El modelos de tensores (array 3D)
que usamos surge de la necesidad de representar la marca o huella de comportamiento de transacciones que realiza un cliente en un determinado periodo Per
(en nuestro caso cada semana), las dimensiones que representamos en nuestro tensor son:
d
: los unidades de tiempo que tienen el periodoPer
(en nuestro caso cada día).t
: representa la ventanas de tiempo end
(en nuestro caso son 4 turnos)mccg
: representa la tipo de consumo que realiza el cliente.
La representacion del Tensor es la siguiente:
Los datos para el análisis de tensores los puede descargar en dropbox; los demas archivos y el codigo se encuentran aquí.
git clone https://github.com/johnkevinbarrera/TemporalTXs.git
Una lista de los valores que contienen cada variable
d
: {lunes, martes, miércoles, jueves, viernes, sábado, domingo}t
: {madrugada, mañana, tarde, noches}mccg
:i
: 1,2,...,n; donden
= número de mccg en los datos de entrada (SJL:28
).
John Barrera
Inicia jupyter notebook
en el path de CLUSTER OF TENSORS
.
Los footprint representa una unidad de comportamiento de un cliente y representa 7 días de la semana, también son la unidad de datos que entra a nuestro modelo, son los tensores
.
Dado:
Sesion de TX
s = {cliente, timestamp, Monto}
Cada cliente tiene una secuencia de sesiones de TX (S)
S = { s1, s2 , s3, ..., sn} n: # de sesiones de cada cliente
Resume un conjunto de TXs en un perido de "d" dias
Dado:
t
d
mccg
T cada semana
Para cada cliente:
S = {s1, ..., sn}
obtenemos: SS = {U(1), U(2), U(3), ...,U(m)} obviamente m <=n
Para poder procesarlos los footprints son representados como vectores, de la siguiente manera.
Mostramos la evolución de los comportamientos en el tiempo, desde la Fecha Inicial, hasta la fecha Final de nuestra poblacion de datos analisados. También observamos que la semana 7 del 2017 hay una caida en el numero de casi todos los comportamientos de consumo.
Representamos en centroide del cluster 34 porque es el el mas frecuente, (podemos representar los n cluster globales que se muestran), Recuerda que los centroides son tensorres, asi que mostramos en 3 gráficos, uno por cada 2 dimeciones.
Aquí representamos un conteo por el numero de Semanas acumulado en las que participan los clientes, por ejemplo:
Si el cliente 1 tiene un 3 semana {s1,s10,s32}, se clasificara con actividades en 3 semanas, entonces oincluira la 1,2 y 3.
Aquí representamos un conteo por el numero de Semanas en las que participa cada cliente, por ejemplo:
Si el cliente 1 tiene un 3 semana {s1,s10,s32}, se clasificara solo como 3.
Tensors