Bir xml dosyası ayrıştırmam gerekiyor, bu da benim durumum için en iyi yöntem. beautifulsoup4, ElementTree, vb. oldukça büyük bir dosya. Ben Pencereleri 10 64bit çalışan piton var 2.7.11 32bitPython ayrıştırma xml dosyası
xml dosyası: http://pastebin.com/jTDRwCZr
Ben kullanarak farklı diller içeren dosya xml bu çıktıyı almaya çalışıyorum "div xml: lang =" İngilizce " " ingilizce için. Bunu başarmak için lxml ile beautifulsoup'i nasıl kullanabileceğime dair herhangi bir yardım? zaman ayırdığın için teşekkürler.
<tt xmlns="http://www.w3.org/2006/04/ttaf1" xmlns:tts="http://www.w3.org/2006/04/ttaf1#styling">
<head>
<styling>
<style id="1" tts:textOutline='#000000 2px 2px' tts:color="white"/>
</styling>
</head>
<body>
<div xml:lang="English">
<p begin="00:00:28.966" end="00:00:31.385" style="1">
text text text...
</p>
</div>
</body>
</tt>
lxml ile BeautifulSoup neredeyse hiçbir zaman kötü bir seçim değildir. – Borealid
Ne istediğinizi net değil. Sadece ingilizce dil almayı ve başka dilleri görmezden gelmeye mi çalışıyorsun? – mhawke
@mhawke evet, tam olarak ne olduğunu açıklamak için özür dilemeye çalışıyorum. sadece ingilizce dil almayı denemek ve geri kalanını görmezden gelmek. – Yami