| |
|
|
p.specht
| Unscharfe String-Vergleiche ===================== Es no bastante simplemente, Eingaben con Tippfehlern vom Computer trotzdem erkennen que se. Der Levenshtein-Algorithmus erlaubt zumindest, einfache Preller o. Auslassungen a erkennen. Etwas mejor es en Datenbanken el SOUNDEX-Función, el allerdings meist para Inglés optimiert es.
Das Gelbe vom Ei es el Original-Levenshtein jedenfalls todavía no. Lo fehlt z.B. una Änderung el "Kostenbewertung" (Variable cost&) en Abhängigkeit de möglichen Hörfehlern (y,ü,i,j ; sh sch ; t d ; p b; k g; h _ ), y vieles más mehr. Hier sólo veces una Base-Proc para rumspielen:
'### P. Pájaro carpintero Nov. 2010; XProfan 11a Interpreter ###
Título de la ventana "Levenshtein-Distanz (Stringvergleich)"
Cls @rgb(200,200,100)
imprimir " EINGABETEIL SELBST GESTALTEN!"
waitinput
FIN
proc LD' Compute Levenshtein-Distance
parámetros s$,t$
s$=lower$(s$):var m&=len(s$)
t$=lower$(t$):var n&=len(t$)
declarar d&[m&,n&],i&,j&,cost&,mi&,c&
caso m& = 0 : volver n&
caso n& = 0 : volver m&
i&=0 : mientras que i&<=m& : d&[i&,0]=i& : inc i& : endwhile
j&=0 : mientras que j&<=n& : d&[0,j&]=j& : inc j& : endwhile
i&=1
WHILE i&<=m&
j&=1
Mientras que j&<=n&
cost&=1
caso Mid$(s$,i&,1)=Mid$(t$,j&,1):cost& = 0
mi&=d&[i&-1,j&]+1
c&=d&[i&,j&-1]+1
caso c&<mi& : mi&=c&
c&=d&[i&-1,j&-1]+cost&
caso c&<mi& : mi&=c&
d&[i&,j&]=mi&
inc j&
EndWhile
inc i&
ENDWHILE
volver d&[m&,n&]
ENDPROC
|
|
|
| XProfan 11Computer: Gerät, daß es in Mikrosekunden erlaubt, 50.000 Fehler zu machen, zB 'daß' statt 'das'... | 10.04.2021 ▲ |
|
|
|
|
RudiB. |
Unscharfe String-Vergleiche
Das hört se fast como Heisenbergsche Unschärfe-Relation a. Ist me a hoch....klingt sin embargo muy interessant. Aber el es una Problema el no veces Google con seinen mächtigen Maschinen así wirklich a 100% umsetzen kann. Und el son como sí nun wirklich bien.... Posesiones mich auch ya con diesem Problema rumgeschlagen. Como es antes allem veces, si una Buchstaben a viel oder Zuwenig en el String/Wort hast, entonces hast Usted eigentlich ya perdido....como va sólo Annäherung y Wahrscheinlichkeit . Ist Schwierig...... |
|
|
| |
|
|
|
p.specht
| Como podría dir auch Michael Wodrichs Umsetzung el sog. "KÖLNER PHONETIK" helfen! Board-Suchbegriff: Kölner Phonetik Soundex Gruss
P.S.: Google benutzt el MCPA-Algorithmus, samt adaptiven Verbesserungen. Descripción (engl.) al 2021-04-14 todavía hier: [...] |
|
|
| Computer: Gerät, daß es in Mikrosekunden erlaubt, 50.000 Fehler zu machen, zB 'daß' statt 'das'... | 14.04.2021 ▲ |
|
|
|
|
Michael W. | Bajo "Soundexing" y "Phonetik" hay en Wikipedia así einiges darüber. |
|
|
| |
|
|
|
p.specht
| Auch de Michael gab hay algo a Kölner Phonetik: [...] |
|
|
| XProfan 11Computer: Gerät, daß es in Mikrosekunden erlaubt, 50.000 Fehler zu machen, zB 'daß' statt 'das'... | 08.05.2021 ▲ |
|
|
|