Bir RSS 2.0 beslemesindeki başlık etiketini, o özet akışındaki her bir giriş için üç farklı değişkene ayrıştırmaya çalışıyorum. Gördüğünüz gibi, çünküPython ayrıştırma
ben dahilfeed = getfeed("http://www.tourfilter.com/dallas/rss/by_concert_date") for item in feed: print repr(item.title[0:-1])
, item.title olduğuna dair: Her başlık [eksi sondaki )
] Aşağıdaki kodu ile yazdırmak böylece elementtree kullanma Zaten RSS ayrıştırıldı ettik Hakkında pek bilmediğim repr() veri türü.
interaktif penceresinde özel bir repr(item.title[0:-1])
print
ed şuna benzer:
'randy travis (Billy Bobs 3/21' 'Michael Schenker Group (House of Blues Dallas 3/26'
kullanıcı bir grup seçer ve ben umut, 3 değişkenler (bant, mekan birer ve içine her item.title
ayrıştırma sonra tarih ... veya muhtemelen bir dizi veya bilmiyorum ...) sadece seçilen grupla ilgili olanları seçin. Daha sonra, coğrafi kodlama için Google'a gönderilir, ancak bu başka bir hikaye.
regex
'dan bazı örnekler gördüm ve bunları okuyordum, ancak çok karmaşık görünüyor. Bu mu? Buradaki birisinin bunu nasıl akıllıca yapacağı konusunda bir fikir sahibi olabileceğini düşündüm. re
modülünü kullanmalı mıyım? Çıktının şu anda repr()
s olduğu önemli mi? Daha iyi bir yolu var mı? (Ben yazı ve bu da notların sadece tür benim pseudoPython olduğu) Ben gibi bir döngü kullanmak düşünüyordum:
list = bandRaw,venue,date,latLong for item in feed: parse item.title for bandRaw, venue, date if bandRaw == str(band) send venue name + ", Dallas, TX" to google for geocoding return lat,long list = list + return character + bandRaw + "," + venue + "," + date + "," + lat + "," + long else
Sonunda, .csv seçilen girdileri (olmalı virgülle ayrılmış dosya şu şekilde görünebilir:
band,venue,date,lat,long randy travis,Billy Bobs,3/21,1234.5678,1234.5678 Michael Schenker Group,House of Blues Dallas,3/26,4321.8765,4321.8765
Umarım bu sormak için çok fazla değildir. Kendi başıma bakacağım, sadece cevap verdiğinden emin olmak için buraya göndermem gerektiğini düşündüm.
Yani, soru şu ki, her repr(item.title[0:-1])
'u feed
'da en iyi bir .csv dosyasında birleştirebileceğim 3 ayrı değere nasıl ayrıştırabilirim?
Cevabınız için teşekkürler! Bu çok yardımcı olur! Biraz kafam karıştı ... Alanları Google'a göndermek ve birleştirmek için tek tek belirlemem gerekiyor. Her bir değeri nasıl arayabilirim? Örneğin, değerleri nasıl birleştiririm? – Alan
Regex, grup ve mekan adlarında sondaki boşlukları bırakır, ancak düzeltmesi kolaydır. –
Evet, ben de fark ettim, ama her 'item.title' içindeki ilk iki değerde '[0: -1]' trickini çektiğimi düşündüm. – Alan