Dizin üzerinde sorgulayan ve daha sonra belirli bir alana bağlı olarak sender_not_analyzed
toplayan bir elasticsearch sorgum var. Daha sonra, üst "gönderenler" için kovalar döndüren sender_not_analyzed
aynı alanda bir terim topluca kullanın. Benim sorgusu şu anda geçerli:Elasticsearch Sorgu benzersiz altyazılar tarafından toplu hale getirildi (e-posta etki alanı)
{
"size": 0,
"query": {
"regexp": {
"sender_not_analyzed": ".*[@].*"
}
},
"aggs": {
"sender-stats": {
"terms": {
"field": "sender_not_analyzed"
}
}
}
}
: Ben her benzersiz e-posta etki alanı için tek kova şekilde toplanmış olarak yazabilirsiniz nasıl
"aggregations": {
"sender-stats": {
"buckets": [
{
"key": "<Mike <[email protected]>@MISSING_DOMAIN>",
"doc_count": 5017
},
{
"key": "[email protected]",
"doc_count": 3963
},
{
"key": "[email protected]",
"doc_count": 2857
},
{
"key": "[email protected]",
"doc_count":1544
}
, örneğin foo.com
bir doc_count
olurdu (3963 + 2857) 6820? Bunu regex birleştirme ile yapabilir miyim, veya dizeyi @ dizesinin sonuna kadar bölmek için bir çeşit özel analizci yazmam gerekir mi?