El análisis de la canasta de mercado (MBA) es una técnica analítica utilizada para predecir las decisiones de compra futuras de los clientes. Estudia patrones de compra históricos y preferencias del cliente para predecir lo que preferirá comprar junto con los artículos existentes en su canasta (o carrito). También se conoce como «análisis de afinidad» o «minería de reglas de asociación». Aplicación Hay una serie de aplicaciones para el análisis de la canasta de mercado. Algunos de ellos son: Diseño de la tienda: según MBA, puede colocar productos en su tienda minorista juntos para generar ingresos. Por ejemplo, un cliente que compra pan, probablemente compraría queso o mermelada. Podrían colocarlos el uno al otro cerca para que los consumidores los noten o retiren para comprarlos. Gestión de inventario: lo ayudará a predecir futuras compras de clientes durante un período de tiempo. Usando sus datos de ventas históricas, podrá predecir qué artículo probablemente se quedará corto lo ayudará a mantener las acciones en una calidad óptima. Colocaciones de contenido: los editores y bloggers en línea pueden usarlo para mostrar contenido que los usuarios tienen más probabilidades de leer a continuación. Esto ayudará a reducir la tasa de rebote, mejorar el compromiso y dar como resultado un mejor rendimiento en los resultados de búsqueda. También se utiliza en motores de recomendación para proporcionar el mejor contenido al análisis del mercado de la canasta de reglas de la asociación de conceptos del usuario se realiza principalmente en función de un algoritmo llamado «Algoritmo Apriori». El resultado de este análisis se llama reglas de asociación. Tomemos un ejemplo para comprender mejor el concepto. Considere el siguiente conjunto de datos: Transacción Artículo 1 Artículo 2 Artículo 3 1 Milk Tea Tea Powder 2 Milk Jugar Tea Powder 3 Milk Tea Tea Powder 4 Milk Sugar 5 Milk Sugar Para este conjunto de datos, podemos escribir las siguientes reglas de asociación: Regla 1: Si se compra la leche, entonces se compra el azúcar y se compra a Vice Versa Regla 2: si se compran la leche y el azúcar, luego se compra el té en polvo en el 60% de las transacciones. Este ejemplo es extremadamente pequeño. En la práctica, una regla necesita el apoyo de varios cientos de transacciones, antes de que pueda considerarse estadísticamente significativo, y los conjuntos de datos a menudo contienen miles o millones de transacciones. Tenga en cuenta que las reglas de asociación están escritas en formato «if-then». También podemos usar el término «antecedente» para IF y «consecuente» para entonces. Soporte El soporte muestra la probabilidad en favor del evento bajo análisis. Es la fracción de transacciones en el conjunto de datos que contiene ese producto o un conjunto de productos. Más alto soporte, más popular es el paquete de productos o productos. Por ejemplo, el apoyo de «si la leche y el azúcar, entonces el té en polvo» son 3/5 transacciones o el 60% de las transacciones totales. Confianza La confianza es la probabilidad condicional de que el cliente compre que el producto A también compre el producto B. expresa la eficiencia operativa de la regla. Mayor la confianza, más fuerte es la regla. Calculó como la relación de la probabilidad de ocurrencia del evento favorable a la probabilidad de la ocurrencia del antecedente. Por ejemplo, la confianza de la leche, el azúcar y el té en polvo se puede expresar como número de transacciones que incluyen leche y azúcar (antecedente) y té en polvo (consecuente) es 3 el número de transacciones que contienen solo leche y azúcar (antecedente)) es 5. P (leche y azúcar y té en polvo)/P (leche y azúcar) = 3/5 = 60% Por lo tanto, podemos decir que la regla de asociación tiene una confianza de 60%. Relación de elevación Cálula la eficiencia de la regla para encontrar consecuencias, en comparación con una selección aleatoria de transacciones. En general, una relación de elevación de mayor que uno sugiere cierta aplicabilidad de la regla. Un elevador superior a 1 indica que la presencia de A ha aumentado la probabilidad de que el producto B ocurra en esta transacción. Un elevador menor de 1 indica que la presencia de A ha disminuido la probabilidad de que el producto B ocurra en este elevador de transacción (A> B) = Confianza (A> B) / Soporte (B) La confianza no mide si la asociación entre A y B es aleatoria o no. Mientras que el elevador mide la fuerza de asociación entre dos elementos. En el análisis de la canasta de mercado, elegimos las reglas con un ascensor de más de uno porque la presencia de un producto aumenta la probabilidad de los otros productos en la misma transacción. Las reglas con mayor confianza son aquellas en las que la probabilidad de que aparezca un elemento en el RHS es alta dada la presencia de los elementos en el LHS. Análisis de la canasta de mercado En R consideremos la siguiente declaración del problema: un vendedor está interesado en saber qué producto se compra con qué producto o si ciertos productos se compran juntos como un grupo de artículos que pueden usar para estrategias en las actividades de venta cruzada. El conjunto de datos utilizado en el ejemplo se llama Groceries.csv y se puede descargar aquí. Primero deberá instalar el paquete «Arules» en R. Biblioteca (ARULES) GRACH <- Read.Transactions ("Groceries.csv", sep = ",") Si importa el conjunto de datos como un archivo CSV, cada elemento de transacción se romperá en varias columnas. Por lo tanto, para evitar esto usamos la función Read.Transactions () (parte del paquete "Arules") que nos permite leer fácilmente nuestros archivos de comestibles como una matriz escasa. Aquí hay algunos comandos que intenta llevar a cabo MBA: itemFrequency (Groc) #para examinar la frecuencia de los artículos comprados en Data.ItemFrequencyPlot (GRAT) #PLOT La frecuencia de los artículos comprados. Función Apriori () y proporciona una lista de parámetros, esos parámetros son el nivel de soporte, el nivel de confianza y la longitud mínima de cada conjunto de elementos. Esto nos ayudará a comprender los patrones de transacción en el conjunto de datos. Ahora podemos ver las reglas para nuestro modelo utilizando la función Inspect (). Inspeccionar (comery.rules[1:10) To visualize the results, you can use arulesViz: library(arulesViz)plot(groc.apriori,method="graph",interactive=TRUE,shading=NA) Conclusion Market basket analysis is an unsupervised machine learning technique that can be useful for finding patterns in transactional data. It can be a very powerful tool for analyzing the purchasing patterns of consumers