İki sütunlu bir veri çerçevem var, A
ve B
. Bu bağlamda A
ve B
'un sırası önemsizdir; örneğin, çoğaltmaları için (0,50)
ve (50,0)
'u düşünürdüm. Pandalarda, bu kopyaları bir veri çerçevesinden kaldırmak için verimli bir yol nedir?Pandalar: veri çerçevesinden geri kopyaları sil
import pandas as pd
# Initial data frame.
data = pd.DataFrame({'A': [0, 10, 11, 21, 22, 35, 5, 50],
'B': [50, 22, 35, 5, 10, 11, 21, 0]})
data
A B
0 0 50
1 10 22
2 11 35
3 21 5
4 22 10
5 35 11
6 5 21
7 50 0
# Desired output with "duplicates" removed.
data2 = pd.DataFrame({'A': [0, 5, 10, 11],
'B': [50, 21, 22, 35]})
data2
A B
0 0 50
1 5 21
2 10 22
3 11 35
İdeal olarak, çıktı sütun A
değerleri ile kriteri olacaktır.
Lambda'ya gerek yoktur, '.apply (sıralanmış, axis = 1)' çalışır. – root
@root. Doğru. Daha iyi bir seçenek. – Psidom
Bu cevabı çok seviyorum! Düşündüğüm her şey veri tabanlarına yığılmayı içeriyordu. Bu zekilik bu ihtiyacı ortadan kaldırıyor. – piRSquared