Diskussion:Spracherkennung

aus Wikipedia, der freien Enzyklopädie

Du hast neue Nachrichten auf deiner Diskussionsseite.

Der Artikel Spracherkennung wurde für nicht angemeldete und neue Benutzer gesperrt, da er regelmäßig und in größerem Umfang von Vandalismus betroffen war. Änderungen am Artikel können auf dieser Seite vorgeschlagen werden. Eine Entsperrung des Artikels kann bei den Entsperrwünschen diskutiert werden.

Der Artikel ist wirklich faszinierend. Besonders gut gefallen mir die gesprochenen Beispiele – soll keiner sagen, die WP wäre nicht multimedial ;-)

Was mir an den gesprochenen Beispielen allerdings nicht gefällt, ist die Qualität. Mir scheint es so, als würde am Anfang und am Ende was fehlen, vielleicht ist auch der Ogg-decoder im VLC so schlecht. Vielleicht wären längere Beispiele oder solche mit ein paar Sekunden Stille vorne und hinten nicht schlecht. Aber das sind Details, der Artikel ist verdammt gut. --wahsager 12:10, 18. Dez 2004 (CET)

weder anregung noch kritik; einfach: Lob!!!

Inhaltsverzeichnis

1 Erste Kritik
2 Weblink
3 Aus dem Review
- 3.1 Spracherkennung, 6. November
4 Spracherkennung in Linux
5 Systeme
6 Lesenswert-Diskussion
7 Quellen
8 Sphinx
9 Werbelink
10 Erfolgreich überstandene Abwahl 7.-14. November 2006
11 Philips Marktführer in der Medizinbranche?
12 Toter Weblink
13 Weitere Spracherkennungssoftware für Windows

[Bearbeiten] Erste Kritik

stimmt, der Artikel ist so weit beeindruckend. was mir fehlt ist der bereich der anwendung, das 'warum-und-wozu-spracherkennung'. (einerseits vielleicht richtung arbeitserleichterung, oder auch nur ein interessantes oder auch nur lustiges weiteres feature der computerisierung der lebenswelt?) insbesondere für schwer körperbehinderte menschen aber bedeuten funktionierende spracherkennungsprogramme, dass sie (u.U. erstmals) überhaupt an gesellschaftlichem leben und sozialer interaktion teilnehmen können - oder aber am intellektuellen diskurs (stephen hawking nur als bekanntestes bsp.) - oder aber am bildungssystem. wenn mit der körperbehinderung auch eine sprachliche behinderung (z.b. spasmus) einhergeht, stoßen die programme im moment noch an kaum überwindbare grenzen. Gruß --Rax 01:55, 20. Nov 2004 (CET)

Hallo!

Ich arbeite seit 1993 mehr oder weniger aktiv mit Sprachsteuerung. Ich diktiere im Flugzeug, in der Bahn, auf Bahnhöfen, sogar im Unterricht.sich Die Leute wundern sich immer, aber keiner macht es nach.

Auch dieser Text ist mit Dragon NaturallySpeaking direkt diktiert. Pro Woche erzeuge ich alleine 50-100 KB journalistische Texte, von all den anderen Texten gar nicht zu reden; das könnte ich heute mit den Fingern nicht mehr leisten, weil ich inzwischen an RSI-Syndrom leide - meine Finger würden so sehr schmerzen, daß ich sie nicht mehr bewegen könnte.

Natürlich habe ich mich gefragt, warum sich diese Technologie nicht durchsetzt. Übrigens benutze ich statt der Maus den Stift - genau dasselbe: alle staunen, keiner zieht mit. Die Vorteile liegen in beiden Fällen auf der Hand: man ist viel produktiver, muß sich allerdings auf die neue Technik einlassen, quasi den Führerschein machen. Man könnte interessante Betrachtungen über Fortschritte in der Technologie bzw. Hemmnisse bei der Durchsetzung anstellen.

Die Frage ist: wie bindet man so etwas in die Wikipedia ein? Es handelt sich um persönliche Erfahrungen - eigentlich eine Antwort auf die obige Frage. Hat so etwas einen Platz in der Wikipedia? Wenn ich das richtig verstanden habe, möchte die Wikipedia neutrale, objektive Informationen liefern. 21:32 15.12.2004 --RemBrandt

[Bearbeiten] Weblink

Sehr informativer Artikel! Es ist ja im Moment kaum allgemeinverständliche Literatur zu diesem Thema auf Deutsch zu bekommen... Übrigens: Leider enthält die pdf-Datei hinter dem Weblink "Computerlinguistik: Erkennung und Synthese gesprochener Sprache" nur Inhaltsverzeichnis und Anfang des versprochenen Textes, nicht den vollständigen Aufsatz. Klaus 28.12.2004 00:57

[Bearbeiten] Aus dem Review

[Bearbeiten] Spracherkennung, 6. November

und nochmal Schreibwettbewerb. -- Dishayloo [ +] 11:06, 6. Nov 2004 (CET)

Vorweg: Der Artikel ist wirklich nur sehr knapp an den Top10 des Wettbewerbsvorbeigeschrammt. Der Text wirkt manchmal etwas zerstückelt und durch die vielen sehr kurzen Abschnitte zusammengebastelt. Ein roter Faden des Textes ist (jedenfalls für mich) leider häufig nicht erkennbar. In der Geschichte existiert eine verhältnissmäßig große Lücke von 1994 bis 2004, ist in dieser Zeit gar nichts passiert? Ein Punkt, der nur angeschnitten wird und der mir fehlt ist die Nutzung der Systeme (Wer benutzt sie wofür? Gerade Infosysteme am Telefon (Menüauswahl etc.) sollten erwähnt werden). Einen fetten Bonuspunkt sehe ich in der Verwendung der .ogg-Dateien. -- Necrophorus 10:19, 7. Nov 2004 (CET)

Vorneweg: Der Artikel gefällt mir schon sehr gut. Beim "aktuellen Stand" wären ein paar konkrete Beispiele schön. Im oberen Teil des Artikels fehlt ein Bild, vielleicht ein Mensch, der etwas in ein mikrofon spricht, oder ein science-fiction Bild. Ich würde die Gliederung ändern in

Aktueller Stand (mit Beispielen)
Geschichte
Forschungsgebiete (Lippenlesen, Sprachausgabe)

Die Überschrift Problemstellung hört sich doof an-gibt es da nicht einen treffenderen Begriff. Arbeitsweise oder so? Ich habe nichts über die Erkennung von Dialekten gelesen. Mußten die Programme nicht früher trainiert werden? heute auch noch? Hadhuey 00:03, 12. Nov 2004 (CET)

Der Artikel ist schon nett, aber noch nicht wirklich beeindruckend.

Dabei muss allerdings jedem Wort seine Funktion innerhalb der Grammatik zugewiesen werden. Deshalb werden solche Systeme meist nur für einen begrenzten Wortschatz und Spezialanwendungen verwendet.

Ich bin kein Spezialist für Spracherkennungssysteme, aber Wortartenerkennung ist ein relativ gut gelöstes Problem in der Computerlinguistik. Vor allem der zweite Satz ist ein wenig seltsam. Die meisten Spracherkennungssysteme sind doch sowieso Spezialanwendungen, was ist also das Problem? --zeno 13:04, 20. Nov 2004 (CET)

Die Größe des Wörterbuchs hängt stark von der Sprache ab. Zum einen haben durchschnittliche deutschsprachige Sprecher mit ca. 4.000 Wörtern einen deutlich größeren Wortschatz als englischsprachige mit ca. 800 Wörtern.

Beide Zahlen sind viel zu tief gegriffen.

Im Abschnitt "Homophone": Die Frage Groß- oder Kleinschreibung fällt auch in diesen Bereich.

Dieser Satz steht etwas verloren da.

Bei den Problemen bei Konsonanten/Vokalen sollte noch darauf eingegangen werden, dass Konsonanten abhängig vom Kontext sehr verschieden klingen können.
Zum Aufbau eines Spracherkennungssystem: Was ein "Referenzvektor" ist wissen Laien wahrscheinlich nicht (ich denke zu wissen, was damit gemeint ist, aber sicher bin ich mir auch nicht), dass sollte schon erläutert werden.
Es werden zwei weitere, sehr grundlegende Probleme bei der Spracherkennung ausgeklammert (oder ich habe es "überlesen"): Sprecherabhängigkeit bzw. -unabhängigkeit (individuelle Unterschiede, Akzent, Nicht-Muttersprachler, Sprachstörungen) sowie Einsatz in Umgebungen mit vielen Nebengeräuschen (Großraumbüros, Industriebetriebe, Bahnhöfe/Flughäfen ...).

--zeno 13:21, 20. Nov 2004 (CET)

Aus der Erinnerung: War Dragon Systems nicht von ehemaligen IBM-Mitarbeitern gegründet worden? (womit das gesamte Spracherkennungs-Know-How jener Zeit aus IBM heraus entstanden war) Dragon und IBM lieferten sich doch auf Jahre einen harten Konkurrenzkampf, sdoch im Endeffekt hat Spracherkennung auf dem Massenmarkt nicht eingeschlagen. -- Dishayloo [ +] 02:04, 6. Dez 2004 (CET)

[Bearbeiten] Spracherkennung in Linux

Meines Wissens sind die Bemühungen seitens IBM eine Linux Version zu veröffentlichen im Sande verlaufen... Kann das jemand bestätigen? Gibt es Pläne diese Bemühungen wiederaufzunehmen?

-- Keine Antwort auf Deine Frage, aber eine weitere: Im Text steht "Für das Betriebssystem Linux hat IBM ab 1999 begonnen, die Technologie von ViaVoice zu portieren. Seit 2001 ist die Spracherkennung in dem verbreiteten Linux-Desktop KDE integriert." Als leidenschaftlicher KDE-Nutzer würde ich gerne wissen, wo dies integriert ist. Ich habe nirgends einen Hinweis gefunden. Wenn dafür kein Beleg zu finden ist, bitte streichen. (Der vorstehende, nicht signierte Beitrag stammt von 84.137.234.122 (Diskussion • Beiträge) --Nick-Zug 13:34, 7. Aug 2006 (CEST))

--Ich hab mich aktuell umgeschaut: Eine Spracherkennung ist *nicht* im KDE integriert. Wenn überhaupt, dann gibt es vom KDE unabhängige Entwicklungen, die derzeit aber bestenfalls gesprochene Befehle erkennen können.Quelle z. B. hier im Ubuntuforum [1]. Der Artikel sollte daher um diesen Satz "Seit 2001 ist die Spracherkennung in dem verbreiteten Linux-Desktop KDE integriert." gekürzt werden.--Andi Pehrin 04:45, 5. Okt 2006 (CEST)

[Bearbeiten] Systeme

Ich finde, wenn es um Spracherkennung geht, sollte das Sphinx - System, der Carnegie Mellon University (CMU) nicht fehlen!

Hier geht es zu deren Hauptseite: [2]

Das besondere hieran ist, dass dieses System seinen eigenen Trainer für die, der Spracherkennung zu Grunde liegenden, Akustikmodelle liefert. Meines Wissens nach, hat kein anderer Spracherkenner die Möglichkeit, dies zu tun. Zwar kann man bei einigen die mit ausgelieferten Modelle erweitern, aber, das war's dann auch meistens schon!

Das ganze Projekt ist zudem Open Source und gerade das sollte auch entsprechend honoriert werden, denke ich!

--213.7.27.122 12:27, 13. Aug 2005 (CEST) NeoGermi

[Bearbeiten] Lesenswert-Diskussion

Die Spracherkennung oder auch automatische Spracherkennung ist ein Teilgebiet der angewandten Informatik. Sie beschäftigt sich mit der Untersuchung und Entwicklung von Verfahren, die es Automaten, insbesondere Computern erlauben, gesprochene Sprache zu erkennen (das heißt, in Zeichenfolgen umzuwandeln) und zu verarbeiten.

pro - sehr ausführlicher Technikartikel mit guten Beispielen. -- Achim Raschka 23:13, 20. Aug 2005 (CEST)

Pro - gratulation! sehr informativ! Mario23 01:46, 22. Aug 2005 (CEST)

Pro Antifaschist 666 12:40, 24. Aug 2005 (CEST)

[Bearbeiten] Quellen

Wird erwähnt ohne Gebrauch im Text:

Sonogram Visible Speech Eine Software die Sprache visuell mit Frequenzen darstellt.

Wird im Text verwendet ohne Angabe:

{{Ref|FrostSullivan}}

--chrislb 问题 15:18, 29. Mai 2006 (CEST)

Erledigt, war IP Änderung ohne Erklärung. --chrislb 问题 15:29, 29. Mai 2006 (CEST)

[Bearbeiten] Sphinx

Wie man auf der Projektseite [3] sehen kann, ist Sphinx sowohl für Linux, als auch für Windows und die POSIX-Derivate verfügbar. Daher bitte ändern.

[Bearbeiten] Werbelink

Wie wäre es denn, wenn mal jemand den Werbelink "Grundlagen der Spracherkennung" am Ende der Seite entfernt? (Der vorstehende, nicht signierte Beitrag stammt von 212.201.84.14 (Diskussion • Beiträge) --Nick-Zug 13:34, 7. Aug 2006 (CEST))

[Bearbeiten] Erfolgreich überstandene Abwahl 7.-14. November 2006

Der Artikel hat seit seiner Lesenswert-Wahl stark verloren. Die beiden Abschnitte Vokabulare und Medizinische Spracherkennung sind etwas Philips-lastig. Der Vokabular-Abschnitt wirkt lieblos hinten dran gehängt, obwohl er doch eher zur Realisierung oder zum aktuellen Stand gehören würde. Die Hörbeispiele sind raus. Ein Abschnitt ist seit dem 29. Mai als Lückenhaft markiert. Der Artikel wurde im August 2005 gewählt.

Daher Contra --Zombi 22:00, 7. Nov. 2006 (CET)

Den Lückenhaft-Baustein habe ich verbrochen und er gehört dort eigentlich nicht rein; lückenhaft nur dann, wenn etwas essentielles fehlt. Das Thema selbst ist mE weiterhin lesenswert, die Links auf die eingesetzten System ist (ebenfalls mE) von sehr marginalem Interesse. die Hörbeispiele wurden leider gelöscht, der Artikelautor hat sich auf meine Nachfrage bisher nie gemeldet. Schade. --chrislb 问题 22:10, 7. Nov. 2006 (CET)

Pro Deckt sehr viele Aspekte dieses Themas gelungen. Von daher klar lesenswert. 134.100.172.24 15:10, 9. Nov. 2006 (CET)

Pro Finde den Artikel auch absolut lesenswert. Die Notwendigkeit des Lückenhaft-Bausteins kann ich nicht bewerten, aber wenn der Setzer selbst sagt, dass er nicht reingehört... - Gancho Kolloquium 11:25, 10. Nov. 2006 (CET)

Ich bitte um einen Blick auf diesen Diff – die Unterschiede sind marginal und der Artikel braucht einen einzigen Edit von jemandem, der sich mit der Materie auskennt. Chris, magst du das nicht selbst machen? --h-stt !? 14:08, 10. Nov. 2006 (CET)

[Bearbeiten] Philips Marktführer in der Medizinbranche?

"Marktführer bei medizinischen Spracherkennungssystemen ist laut der Unternehmensberatung Frost & Sullivan der Hersteller Philips mit dem System „SpeechMagic“, gefolgt von „Dragon Naturally Speaking“[1]."

Die Studie spricht von 7000 SpeechMagic-Installationen weltweit im Medizinsektor. Wenn ich als (eher kleiner) Dragon-Händler meine eigenen Installationen in Arztpraxen und Krankenhäusern als Basis nehme und mit der Anzahl der auf diesem Gebiet weltweit tätigen Nuance-Partner multipliziere, dann komme ich auf weit mehr als 7000 Dragon-Installationen. Bei meiner Rechnung werden nur die sogenannten Certified Partner von Nuance berücksichtigt, nicht aber andere Vertriebskanäle, über die Ärzte und Krankenhäuser auch die Dragon-Software beziehen können. Geggo 14:11, 24. Nov. 2006 (CET)

[Bearbeiten] Toter Weblink

Bei mehreren automatisierten Botläufen wurde der folgende Weblink als nicht verfügbar erkannt. Bitte überprüfe, ob der Link tatsächlich down ist, und korrigiere oder entferne ihn in diesem Fall!

http://www.speechrecognition.philips.com/|titel=Phillips
- In Spracherkennung on Thu Nov 9 14:11:19 2006, 404 Not Found
- In Spracherkennung on Mon Nov 27 17:22:24 2006, 404 Not Found

[Bearbeiten] Weitere Spracherkennungssoftware für Windows

- Vocon der Firma Nuance

--Zwobot 17:22, 27. Nov. 2006 (CET)

Von „http://de.wikipedia.org../../../s/p/r/Diskussion%7ESpracherkennung_de80.html“

Kategorie: Wikipedia:Vandalismussperre