2016-08-02 53 views
9

Emojiler iyi tanımlanmış bir unicode yelpazesine mi sahipler?Emojiler için kontrol edilebilecek belirli bir unicode kod noktası aralığı var mı?

Ve bir kod noktasının python 2.7'de bir emoji olup olmadığını kontrol etmenin kesin bir yolu var mı?

Bu konuda herhangi bir bilgi bulamıyorum. kaynaklardan Birkaç aralığına çekmişlerdir:

\U0001f600-\U0001f650 

Ama mesela

, bu aralığın dışında kalan kod noktası

\U0001f918 

sahiptir.

Teşekkürler.

+0

İncelemeye değer olabilir: https://github.com/mathiasbynens/emoji-regex Dinamik ifadeyi dinamik olarak oluşturmak için emojiyi güncellemek için dinamik olarak oluşturuyorlar, – Keozon

+1

Neyin ne olduğunu nasıl tanımladığınızı bile sordum. Bir emoji, ama görünüşe göre bu aslında Unicode standardı tanımlayan bir şey. – user2357112

+0

Python'un Unicode desteği yerleşik değil mi? Anlamı, Unicode.org başka bir SMILING KITTY eklediğinde onun tablolarının yeniden hesaplanması gerekiyor mu? (Ben benzer bir konuda başka bir cevapta bahsedildiğini hatırlıyorum.) – usr2564301

cevap

5

regex, Unicode özelliğine göre eşleştirmeyi destekler, ancak ne yazık ki (henüz) emoji-specific properties desteğini desteklemez. Bu arada

>>> regex.match(ur'\P{Emoji=yes}', u'') # NOTE: Doesn't (yet) work 

, here's the emoji table from unicode.org: Bu olduğunda, onları bulmak kadar basit olacaktır.

+3

Bu, '#' ve '*' gibi karakterleri içerdiğini unutmayın, çünkü çok daha fazla karakterin beklediğinizden daha fazla karaktere sahip olması gerekir. . "Emoji_Presentation = yes" üzerindeki filtreleme daha seçicidir, ancak siz * DOĞRU ANGER BUBBLE gibi emoji olarak düşünebileceğiniz karakterleri hariç tutabilir. – user2357112