2016-04-12 24 views
1

Çeşitli varlık sınıfları için dizinler içeren ve çoğu farklı tarihlerde başlayan bir csv dosyası var. Aynı temel yıllara sahip olan varlık sınıfları için yeni endeksler oluşturmak istiyorum. Aşağıda sahip olduğum verilerin bir alt kümesidir.Sütun değerlerini, koşullara göre birden çok değere bölüyor

indexes <- read.csv("AssetClassIndexes.csv") 
indexes$Date <- as.Date(indexes$Date, '%m/%d/%Y') 
indexes %>% 
    filter(Date > as.Date('2013-01-01')) %>% 
    select(Date, Large.Cap.Stocks, Mid.Cap.Stocks, Precious.Metals) 



    Date  Large.Cap.Stocks Mid.Cap.Stocks Precious.Metals 
1 2013-01-31   130.9160  58.13547   651.1803 
2 2013-02-28   132.6932  58.70621   658.3433 
3 2013-03-31   137.6696  61.51427   690.4047 
4 2013-04-30   140.3220  61.90042   684.9505 
5 2013-05-31   143.6044  63.29899   720.4309 
6 2013-06-30   141.6760  62.13056   723.7449 
7 2013-07-31   148.8850  65.97987   777.3744 
8 2013-08-31   144.5731  63.50743   750.3217 
9 2013-09-30   149.1068  66.81690   803.2194 
10 2013-10-31   155.9609  69.29937   831.1715 
11 2013-11-30   160.7137  70.21606   877.3015 
12 2013-12-31   164.7823  72.38485   893.8825 
13 2014-01-31   159.0851  70.84785   854.2835 
14 2014-02-28   166.3623  74.30846   890.2488 
15 2014-03-31   167.7607  74.58250   898.8842 
16 2014-04-30   169.0008  73.41721   868.2323 
17 2014-05-31   172.9679  74.72066   869.1005 
18 2014-06-30   176.5410  77.81163   906.8195 
19 2014-07-31   174.1063  74.48576   853.8612 
20 2014-08-31   181.0715  78.27180   892.6265 
21 2014-09-30   178.5322  74.71220   841.8361 

Yapmak istediğim, çeşitli tarihlere dayanan çok sayıda temel dizin oluşturmaktır.

BaseDates <- 
    c(
    '1973-12-31', 
    '1981-06-30', 
    '1984-03-31', 
    '2001-03-31', 
    '2007-12-31' 
) 

Ben beni bir tarihe dayanan bir dizin oluşturmanızı sağlar Aşağıdaki kod satırını var, ama her şeyden baz tarihleri ​​nasıl anlamaya olamaz. Sanırım bir çeşit uygulama işlevi gerektirir. baska öneri?

cevap

1

Yapabileceğiniz birden çok yaklaşım vardır. Önerilen yaklaşımınız, tarihleri ​​tek bir tarihle eşleşen bölütlere (mutate_each) bölünür. Tüm tarihlerinizde _apply veya başka bir komutla yineleyebilirsiniz.

Aşağıdaki alternatif yaklaşım, satırları bir vektörle bölerek, tarih boyunca yinelemek için lapply kullanır. Zor kısım, bir veri çerçevesinin satırlarla bölünmesidir. Burada, veri çerçevesi (t) aktarılır ve bir vektör (as.numeric) ile bölünür, sonra tekrar orijinal biçime (additional methods here) geri aktarılır.

#indexes = the subsetted [21 x 4] data in your example 
#Sample some dates based on your example data 
BaseDates <- indexes[seq(1, 21, by=5), "Date"] 

IndexThemALL <- lapply(BaseDates, function(z) { #z = each BaseDate 
        data.frame(
        IndexDate = z, 
        Date = indexes$Date, 
        t(t(indexes[, cols])/as.numeric(indexes[indexes$Date == z, cols])) 
        ) 
        }) 

# Optional: collapse a list into a dataframe 
IndexThemALL <- dplyr::rbind_all(IndexThemALL) 

#Source: local data frame [105 x 5] 
#IndexDate  Date Large.Cap.Stocks Mid.Cap.Stocks Precious.Metals 
#1 2013-01-31 2013-01-31   1.000000  1.000000  1.000000 
#2 2013-01-31 2013-02-28   1.013575  1.009817  1.011000 
#3 2013-01-31 2013-03-31   1.051587  1.058119  1.060236 
#4 2013-01-31 2013-04-30   1.071848  1.064762  1.051860 
+0

Teşekkür ederiz. Bu hile yaptı. – user3456446