| |
|
|
p.specht
| Unscharfe String-Vergleiche ===================== c'est pas entier simple, Eingaben avec Tippfehlern vom ordinateur quand même erkennen trop laisser. qui Levenshtein-Algorithmus erlaubt zumindest, simple Preller bzw. Auslassungen trop erkennen. quelque chose besser ist chez Datenbanken qui SOUNDEX-Funktion, qui allerdings meist pour Englisch optimiert ist.
cela Gelbe vom ouf ist qui Original-Levenshtein jedenfalls encore pas. Es fehlt z.B. une Changement qui "Kostenbewertung" (Variable cost&) dans dépendance de möglichen Hörfehlern (y,ü,i,j ; sh sch ; t d ; p b; k g; h _ ), et vieles d'autre plus. ici seulement la fois une la base-Proc zum rumspielen:
'### P. Specht Nov. 2010; XProfan 11a Interpreter ###
Titre de la fenêtre "Levenshtein-Distanz (Stringvergleich)"
Cls @rgb(200,200,100)
imprimer " EINGABETEIL SELBST GESTALTEN!"
waitinput
FIN
proc LD' Compute Levenshtein-Distance
parameters s$,t$
s$=lower$($ S):var m&=len($ S)
t$=lower$(t $):var n&=len(t $)
declare d&[m&,n&],i&,j&,cost&,mi&,c&
cas m& = 0 : return n&
cas n& = 0 : return m&
i&=0 : tandis que i&<=m& : d&[i&,0]=i& : inc i& : endwhile
j&=0 : tandis que j&<=n& : d&[0,j&]=j& : inc j& : endwhile
i&=1
WHILE i&<=m&
j&=1
Tandis que j&<=n&
cost&=1
cas Mid $(s$,i&,1)=Mid $(t$,j&,1):cost& = 0
mi&=d&[i&-1,j&]+1
c&=d&[i&,j&-1]+1
cas c&<mi& : mi&=c&
c&=d&[i&-1,j&-1]+cost&
cas c&<mi& : mi&=c&
d&[i&,j&]=mi&
inc j&
Endwhile
inc i&
ENDWHILE
return d&[m&,n&]
ENDPROC
|
|
|
| XProfan 11Computer: Gerät, daß es in Mikrosekunden erlaubt, 50.000 Fehler zu machen, zB 'daß' statt 'das'... | 10.04.2021 ▲ |
|
|
|
|
RudiB. |
Unscharfe String-Vergleiche
cela hört sich presque comment qui Heisenbergsche Unschärfe-Relation à. Ist mir trop hoch....klingt cependant très intéressant. mais c'est un Problem cela pas la fois Google avec seinen mächtigen Maschinen so wirklich trop 100% umsetzen peux. et qui sommes là oui eh bien wirklich bien.... Habe mich aussi déjà avec diesem Problem rumgeschlagen. voilà avant allem la fois, si Du une Buchstaben trop viel ou bien Zuwenig im String/mot la hâte, ensuite la hâte Du eigentlich déjà verloren....là allez seulement Annäherung et probabilité . Ist Schwierig...... |
|
|
| |
|
|
|
p.specht
| là pourrait dir aussi Michael Wodrichs Umsetzung qui sog. "KÖLNER PHONETIK" aider! Board-Suchbegriff: Kölner Phonetik Soundex Gruss
P.S.: Google benutzt den MCPA-Algorithmus, velours adaptiven Verbesserungen. Beschreibung (engl.) am 2021-04-14 encore ici: [...] |
|
|
| Computer: Gerät, daß es in Mikrosekunden erlaubt, 50.000 Fehler zu machen, zB 'daß' statt 'das'... | 14.04.2021 ▲ |
|
|
|
|
Michael W. | sous "Soundexing" et "Phonetik" gibt es chez Wikipedia so einiges par-dessus. |
|
|
| |
|
|
|
p.specht
| aussi de Michael donnais es quelque chose zur Kölner Phonetik: [...] |
|
|
| XProfan 11Computer: Gerät, daß es in Mikrosekunden erlaubt, 50.000 Fehler zu machen, zB 'daß' statt 'das'... | 08.05.2021 ▲ |
|
|
|