'un verimli kullanımı Veri tabanından R'ye aktarılan birkaç yüz karakter vektörüne sahibiz - her biri 6-7 milyon uzunluğa sahiptir. Bunlar, etiketler için karakter (harfler) içeren sayısal veya faktör verileridir - ayarlanacak düzeyler, tüm faktörler, hepsinin bazı NA'ları vardır. Bir örnekas.numeric() ve factor()
vecA <- c("1",NA, "2",....,NA, "100")
vecB <- c("smith", NA, NA, ... , "jones")
olarak faktör için sayısal ve vecB için VECA zorlamak için etkili bir yolu var mı. Sorun, sayısal ve faktör vektörlerinin veride nerede olduğunu bilmemek ve bunları birer birer gözden geçirmek üzücü.
Bu vektörlerin hepsi aynı nesnede mi, yoksa tek tek nesneler mi? Örneğinizde olduğu gibi düzenli isimleri var mı? –
Her vektörü, bir veritabanından bir seferde bir işlevde arayacağım. Bu işlev paralelleştirilebilir. Bazı dizelerde özel karakterler olacak - ancak sadece faktör tipi verileri için. – Yoda