Fuzzywuzzy - іс-шаралар билеттерін табатын SeatGeek қызметі әзірлеген, сонымен қатар ашық көзі болып табылатын тізбектер мен үлгілер арасындағы айырмашылықтарды есептеу үшін Левенштейн қашықтығын пайдаланатын python кітапханасы. бүкіл интернет арқылы және оларды бір платформада көрсетіңіз.
Python тіліндегі FuzzyWuzzy дегеніміз не?
FuzzyWuzzy - жолдысәйкестендіру үшін пайдаланылатын Python кітапханасы. Анық емес жолды сәйкестендіру – берілген үлгіге сәйкес келетін жолдарды табу процесі. Ол реттіліктер арасындағы айырмашылықтарды есептеу үшін негізінен Левенштейн қашықтықты пайдаланады.
FuzzyWuzzy жүйесіндегі таңбалауыштар жинағының қатынасы дегеніміз не?
FuzzyWuzzy
Токендер жинағы қатынасын пайдалана отырып, Токендер жинағы қатынасы жолдарды жай таңбалау, сұрыптау және қоюдың орнына жалпы таңбалауыштарды алып тастайтын жиын әрекетін орындайды белгілер қайта біріктіріледі. Қосымша немесе бірдей қайталанатын сөздер маңызды емес.
Бұлыңғыр сәйкестік мысалы дегеніміз не?
Анықсыз сәйкестік (шамамен жол сәйкестігі деп те аталады) - шамамен ұқсас, бірақ дәл бірдей емес мәтіннің, жолдардың немесе жазбалардың екі элементін анықтауға көмектесетін әдіс үшін Мысалы, төмендегі сызбада Expedia және Priceline ұсынған Нью-Йорктегі қонақүйлер тізімін алайық.
Token_sort_ratio не үшін пайдаланылады:-?
token_sort_ratio, жол таңбалауыштары алфавит бойынша сұрыпталады, содан кейінбіріктіріледі. Осыдан кейін, қарапайым fuzz. ұқсастық пайызын алу үшін қатынас қолданылады. Бұл осы мысалдағы сот істері сияқты істерді бірдей деп белгілеуге мүмкіндік береді.