Bunu yapmak için çoğunlukla Ruby kullanıyorum ama şimdiye kadarki saldırı planım aşağıdaki gibi: herhangi bir URI verilen verileri ayrıştırmak için rdf rdf, rdf-rdfa ve rdf-microdata veya mida olan gems'i kullanın.RDFa, Microdata, vb. Ayrıştırmanın en iyi yolu nedir? Tekdüze bir şema/kelime bilgisi (örneğin, schema.org) kullanarak geri depolamak ve görüntülemek için gereken en iyi yoldur.
# Schema X to schema.org conversion
#data-vocabulary
DV:
name:name
street-address:streetAddress
region:addressRegion
locality:addressLocality
photo:image
country-name:addressCountry
postal-code:postalCode
tel:telephone
latitude:latitude
longitude:longitude
type:type
#opengraph
OG:
title:name
type:type
image:image
site_name:site_name
description:description
latitude:latitude
longitude:longitude
street-address:streetAddress
locality:addressLocality
region:addressRegion
postal-code:postalCode
country-name:addressCountry
phone_number:telephone
email:email
elimden: Ben schema.org'da gibi tek tip şemaya haritasına örneğin schema.org'u veri-kelime ve opengraph arasında dönüşüm açıklamaya çalışır bu yaml dosyasını almak için en iyi olacağını düşünüyorum Daha sonra bilgileri tek bir biçimde saklayın ve bunları schema.org sözdizimi ile yeniden görüntüleyin.
Diğer bölüm belirleme türüdür. Schema.org'dan sonra tablolarımı örneklendiririm ve 'Thing' türünü (Thing) bilmek istiyorum. Yani bir opengraph türü 'bar' ayrıştırırsam, 'BarOrPub' (BarOrPub) olduğunu saklarım.
Bunu yapmanın daha iyi bir yolu var mı? Otomatik bir şey mi? Orada zaten bir çözüm var mı? Herhangi bir girdi takdir edildi.
DÜZENLEME:
RDF::RDFa::Reader.open(url) do |reader|
reader.each_statement do |statement|
tag = statement.predicate.to_s.split('/')[-1].split('#')[-1]
Rails.logger.debug "rdf tag: #{tag}"
Rails.logger.debug "rdf predicate: #{statement.predicate}"
if all_tags.keys.include? tag
Rails.logger.debug "Found mapping for #{statement.predicate} and #{all_tags[tag]}"
results[all_tags[tag]] = statement.object.to_s.strip
end
end
end
Doğrulama için teşekkürler! Alternatif yaklaşım, en temiz ve en güvenilir gibi geliyor. – imorsi