2016-04-04 45 views
1

60 ay boyunca farklı müşteri grupları için müşteri etkinliğini yansıtmanın bir yolunu bulmaya çalışıyorum. Bu gruplar çok sayıda faktöre dayanabilir: planlar, edinim kanalı, edinme ayı vb. Gidip ben iyi yaklaşım regresyon kullanarak birkaç farklı müşteri grupları için tamamlanmış verilerin 60 aya dayanan bir model geliştirmek için olacağını düşündüm ben öğreniyorum. Model, son kullanıcının ilgilendiği farklı müşteri gruplarına uygulanabilir.Farklı veri kümelerini tahmin etmek için mevcut regresyon katsayılarını ölçekleme

Model çoğu durumda iyi çalışıyor gibi görünüyor, ancak yalnızca farklı bir satın alma etkinliğine sahip gruplar var. Örneğin, modelim, müşterilerin her ay ortalama 15 dolar harcadıkları verilere dayanıyor. Bununla birlikte, ortalama harcamaların 5 $ olduğu birkaç müşteri grubu vardır; Tipik olarak, model müşteri grubunun 2-3 aylık verileriyle çalışır.

Katsayıları "ölçeklendirmenin" bir yolu var mı, böylece model farklı harcama seviyelerine sahip farklı gruplar için iyi bir şekilde projelendiriliyor mu? Bu bir istatistik sorusu daha fazla .. Herhangi bir rehberlik çok takdir edilecektir.

+0

Örnek verileri göndermeniz ve daha önce yaptığınız analizi açıklamak için daha iyi bir iş yapmanız gerekir. Bu öğeler olmadan, sorunuzun netlik olmaması nedeniyle kapatılacağını tahmin ediyorum. –

cevap

0

Sorununuzu doğru şekilde anlarsam, ortalama harcamanın 15 ABD doları olduğu verileri kullanarak bir regresyon modeli oluşturursunuz, ancak şimdi ortalama harcama 5 ABD doları olan farklı bir grubun sonuçlarını tahmin etmek için bu modeli kullanmaya çalışıyorsunuzdur. Bu senin tahminlerini atıyor mu?

Bunun nedeni, modelinizin özelliklerinin yanlış olmasından kaynaklanmaktadır. Bu işlemek için doğru yolu regresyon modeli (bütün verilerle yani tren) bina yaparken hem 15 $ ve 5 $ grupları eklemektir. Bir popülasyon üzerinde antrenman yapmak için regresyon kullanmamalı ve daha sonra sadece hedef modelinize (5 $ grup)

yanlış modeli uyguladığınız için test etmemelisiniz. Tüm ilgi gruplarından veri kullanan model, deneyebileceğiniz başka bir şey sadece 15 dolarlık bir grupla standart bir model oluşturmaktır. Bunun pratikte ne kadar iyi çalıştığından emin değilim, modeli oluşturup test etmeniz gerekecek, ancak şu gibi bir şey yapacaktır:

$ 15 grup verilerinizi alın ve her bir değeri alarak tahmin değişkenlerini standartlaştırın Bu değişkenin ortalamasını çıkararak ve sonra standart sapmaya bölün: X_standardized = (X - mean(X))/sd(X)

Yeni bir regresyon modeli oluşturmak için bu standart belirleyicileri kullanın.

Yeni modelinizi aldıktan sonra ve $ 5 grubunun değerlerini tahmin etmek istediğinizde, tahmin için ham $ 5 değerlerini iletmek yerine, önce değişkeni standartlaştırmanız ve standartlaştırılmış değeri iletmeniz gerekir. .

Bu

Eğer her seferinde bir değer tahmin etmeye çalışıyorsanız işe yaramayacak ve bir ortalama ve standart sapmayı hesaplamak için 5 $ grup üyelerinin yeterince büyük bir örnek erişimi yoktur.