Uso del análisis predictivo para la detección del fraude en el ecommerce

El fraude en los pagos está aumentando, especialmente en el ecommerce, donde se prevé que las pérdidas por fraude en los pagos en línea superen los USD 48 000 millones en todo el mundo en 2023. Está claro que las empresas en línea necesitan defensas más sólidas para proteger sus ingresos. El análisis predictivo puede ser una de las formas más eficaces que tiene una empresa de ecommerce para detectar el fraude. Mediante el análisis de datos anteriores, tendencias y variables, las empresas pueden crear algoritmos de puntuación del fraude más inteligentes y elaborar estrategias de prevención del fraude más precisas.

El vicepresidente de ClearSale, Rafael Lourenco, explica un proceso de seis pasos para utilizar el análisis predictivo con el fin de detener el fraude en el ecommerce.

Para utilizar el análisis predictivo en la detección del fraude en el ecommerce:

  1. Define tu base de datos histórica de pedidos en línea.
  2. Define qué transacciones incluir en tu base de datos de pedidos.
  3. Analiza los patrones y variables de fraude.
  4. Genera un modelo de los datos recopilados.
  5. Implementa el modelo en línea.
  6. Da seguimiento a los resultados.

Analicemos estos puntos con más detalle.

1. Define tu base de datos histórica

Como con cualquier otro proceso analítico, dice Lourenco, hay que empezar con una base de datos histórica con información de los pedidos en línea. Al crear esta base de datos, piensa detenidamente en el marco temporal de los pedidos. ¿Tu base de datos incluirá pedidos de seis meses? ¿Pedidos de un año? Lourenco anima a utilizar al menos un año de datos, si están disponibles, para hacerse una idea global de cualquier estacionalidad de las ventas.

Por otro lado, basarse solo en los pedidos recientes puede ser un problema. ¿El motivo? Los contracargos y el fraude pueden tardar semanas, incluso meses, en aparecer en un balance. Esto significa que intentar predecir las ventas futuras en función de los pedidos del pasado puede ser arriesgado, si no imposible.

En su lugar, recomienda prever un margen seguro de al menos 90 días. Por ejemplo, si empiezas a crear tu base de datos en abril, considera incluir los pedidos que se hicieron entre enero y diciembre del año anterior, y elimina los pedidos de enero a marzo del año en curso, ya que el panorama completo de los contracargos y fraudes de este periodo de tiempo aún no se ha desarrollado.

En ClearSale, nuestra base de datos de detalles de pedidos se remonta a los primeros pedidos de ecommerce realizados y a los primeros días de la prevención del fraude. Como resultado, nuestra base de datos histórica ofrece uno de los panoramas más amplios de fraude y tendencias de fraude disponibles en todo el mundo.

2. Define qué transacciones incluir en tu base de datos de pedidos

Una vez que hayas establecido el plazo para tu análisis, es hora de definir el “qué”: ¿Qué transacciones incluyes en esta base de datos histórica?

Los contracargos solo se producen con determinados métodos de pago, como las tarjetas de crédito. Por lo tanto, no incluyas pagos realizados a través de ACH o cualquier otro método que no genere un contracargo.

De hecho, agregar estos pagos a tu base de datos probablemente acabaría creando un sesgo en tu análisis. Si las transferencias electrónicas ACH son más comunes en la Región A que en la Región B, y tú incluyes pagos ACH en tu base de datos, entonces parecerá que la Región A es un lugar más seguro para hacer negocios. Pero, en realidad, el menor riesgo en la Región A se debe únicamente a que las transferencias electrónicas ACH no dan lugar a contracargos y tienen un menor riesgo de fraude. Así que, cuando intentes predecir los contracargos y el fraude, fíjate solo en los métodos de pago que más contribuyen a ese riesgo.

Después de definir el “qué”, debes ser capaz de transformarlo en una variable binaria, como por ejemplo, si los pedidos realizados en un determinado periodo de tiempo y procesados a través de un determinado método de pago pueden identificarse, en última instancia, como pedidos válidos o no válidos. En términos sencillos, cada pedido que tu sistema apruebe y no se devuelva como contracargo debe considerarse un pedido válido. Cada pedido que se apruebe y devuelva como contracargo debe considerarse un pedido no válido.

Pero aquí es donde se complica: no se pueden utilizar los contracargos como única definición de los pedidos no válidos. Supongamos que tus filtros de fraude evitan todos los pedidos procedentes de Rusia o enviados a este país. Eso significa que nunca sufrirás contracargos, ¿verdad? Parece una buena noticia. Sin embargo, no todos los pedidos procedentes de Rusia o con destino a este país son fraudulentos. Por lo tanto, tu estrategia significa que estás rechazando al menos algunos pedidos legítimos, y eso afecta tu capacidad para identificar patrones futuros y variables asociadas con pedidos tanto válidos como no válidos.

Por otro lado, si no bloqueas automáticamente todos los pedidos con origen o destino en Rusia, podrás entender mejor cuándo un pedido relacionado con Rusia es seguro y cuándo no. Sí, tu estrategia absolutista significa que nunca sufrirás contracargos en estos pedidos, pero también perderás innumerables ventas legítimas. Peor aún, hace que tu base de datos dé la impresión de que no hay fraude en Rusia, y todos sabemos que el fraude está en todas partes.

Pero esa no es la única razón por la que rechazar pedidos automáticamente es perjudicial para tu empresa. Cuando se rechazan pedidos, se obtiene lo que llamamos “datos censurados”, es decir, datos (en este caso, pedidos) que nunca se podrán evaluar de manera objetiva. En el caso de los pedidos rusos rechazados, nunca sabremos cuáles eran realmente fraudulentos.

Para evitarlo, debes definir claramente qué es un pedido válido y qué es un pedido no válido. Lourenco sugiere empezar por identificar tanto los contracargos como los pedidos fraudulentos confirmados que hayas evitado, rechazado o bloqueado. Luego, define los pedidos válidos como las transacciones que se aprobaron y nunca se devolvieron como contracargos.

Para ayudar a determinar qué pedidos deben revisarse automáticamente, ClearSale recomienda un cálculo que multiplica la probabilidad de fraude (una puntuación asignada a los valores de los pedidos basada en experiencias anteriores) por el valor total del pedido para obtener la pérdida esperada. 

Si el costo por pedido para una revisión secundaria es inferior a la pérdida esperada, quizás te convenga revisar los pedidos de ese valor de forma manual. Deberás establecer puntos límite para la aprobación automática realizando los cálculos de pérdida esperada para un rango de valores totales de pedido (de USD 100 a USD 999, de USD 1000 a USD 9999, etc.).

Representa en un gráfico los cálculos de las pérdidas esperadas para cada valor de pedido y habrás creado tu punto límite de aprobación. Cualquier pedido que se sitúe por debajo de la curva debe procesarse automáticamente, y cualquier pedido que se sitúe por encima de la curva debe someterse a una revisión secundaria.

3. Analiza los patrones y variables de fraude

Ahora que ya has configurado tu base de datos y definido cuáles son los pedidos válidos y no válidos, es hora de analizar. Mediante el análisis descriptivo, intenta comprender los patrones y las variables que ayudan a detectar el fraude y a diferenciar los pedidos válidos de los no válidos.

Al analizar los pedidos, crea algunas variables y comprueba si afectan el porcentaje de pedidos no válidos. Por ejemplo, puedes crear una variable de día de la semana para ver si los lunes tienen un índice de fraude mayor o menor que los martes. Si descubres que todos los días de la semana tienen los mismos niveles de fraude, sabrás que no es una variable que valga la pena analizar. Por otro lado, si los días hábiles tienen tasas de fraude muy diferentes, es una variable excelente para incluir en tu análisis.

Aunque Lourenco fomenta la creatividad a la hora de crear variables, hace hincapié en que se deben crear únicamente las variables que puedan analizarse en el momento en que se realiza un pedido. Después de todo, quieres saber de inmediato (tan pronto como alguien realiza un pedido) cuál es la probabilidad de que el pedido sea fraudulento. Por ejemplo, puede que quieras saber cuántos pedidos ha hecho antes un número de teléfono en particular, así que analizas todas las transacciones anteriores y evalúas la probabilidad de que el pedido sea fraudulento.

4. Genera un modelo de los datos recopilados

El cuarto paso es la creación del modelo en sí. Aquí, lo más probable es que necesites la ayuda de científicos de datos, ya que las técnicas para generar modelos van desde estilos de la vieja escuela, como la regresión logística, las redes neuronales y el aprendizaje profundo, hasta enfoques más modernos y complejos.

Con una técnica de análisis de datos denominada ensamble o combinación de modelos, las empresas y los analistas pueden combinar los resultados de varios programas de puntuación del fraude para obtener una única puntuación. Esa puntuación es muy precisa, porque se basa en las fortalezas de todos los programas que aportan datos. ClearSale utiliza la combinación de modelos porque tiene la capacidad de mejorar la detección de fraudes en todo el mundo, y de seguir mejorando a medida que las empresas encuentran formas nuevas y mejores de puntuar sus pedidos.

Independientemente de la técnica utilizada, tu objetivo aquí es traducir todos los datos que has recopilado en información predictiva de la probabilidad de fraude.

5. Implementa el modelo en línea

Cuando pases a la instancia de implementación de la detección de fraudes, deberás poder asignar una puntuación de referencia a cada pedido con tarjeta de crédito que se realice en tu sitio web para predecir la probabilidad de que ese pedido sea fraudulento.

Nota: A menudo es mejor utilizar el mismo recurso que utilizaste en el desarrollo del modelo para ayudarte a implementarlo en tu flujo de decisiones.

6. Da seguimiento a los resultados

Por último, pero no por eso menos importante, está el seguimiento. ¿Está todo funcionando en el mundo real como esperas que lo haga? Podrías pensar que tus compras están igualmente distribuidas entre los días hábiles y los fines de semana, por lo que has entrenado tu modelo en una base de datos en la que la mitad de los pedidos se realizaron en días hábiles y la otra mitad en fines de semana. Pero, cuando implementas tu modelo y haces un seguimiento en la vida real, te das cuenta de que solo el 10 % de los pedidos se realizan durante los fines de semana. Si esto sucede, regresa y modifica tu modelo hasta que se ajuste bien a la forma en que realmente opera tu empresa en línea; e incluso entonces, deberás continuar dando seguimiento para poder adaptarte a medida que tu empresa evoluciona.

Si estás buscando un socio confiable en detección de fraudes para ayudarte a supervisar el panorama de fraudes en constante cambio, necesitas un socio en quien los clientes confíen para proteger sus ganancias. ClearSale ha sido constantemente clasificado como el número 1 en protección contra el fraude en el ecommerce por clientes satisfechos en G2.

Nuestros analistas utilizan una combinación única de análisis humano e inteligencia artificial sólida para identificar patrones de fraude emergentes y evitar que los contracargos y los rechazos erróneos afecten tus ingresos. Contáctanos para saber cómo podemos hacer más eficaz tu estrategia de prevención del fraude.

Protección contra el fraude en el ecommerce para empresas en línea: la guía definitiva