Een toespraak synthese server is een computer in het netwerk die vraagt een menselijke gebruiker om invoer met behulp van spraak. Deze servers is afhankelijk van vele complexe onderliggende technologieën, zoals text-to-speech, stemerkenning synthese en stem. Leren over deze technologieën, en hoe ze samenwerken, kan geven u een betere waardering voor de complexe binnenwerkingen van de toespraak synthese server.
Spraak synthese Server
Veel centra gebruik toespraak synthese servers belt aan route bellers vanuit het hoofdmenu naar een menselijke operator die in een bepaalde afdeling werkt. Deze servers zijn meestal geschikt voor het produceren van spraak, alsmede het begrip van het. Spraak synthese servers worden ook gebruikt in toepassingen van het Web meer toegankelijk en interactief te maken.
Spraaksynthesizer
Een spraaksynthesizer uitgangen herkenbare toespraak en invoer in de vorm van een voorgeprogrammeerde tekst of real-time opdrachten accepteert. Engines voor spraakherkenning synthese die voorgeprogrammeerde tekst vaak verwerken een enkele taak uitvoeren, zoals bezoekers te informeren dat een bepaald gebied ontoegankelijk is. Engines voor spraakherkenning synthese die real-time opdrachten accepteren worden gebruikt om personen met een handicap met een middel om te communiceren, en worden ook gebruikt in telecommunicatiesystemen. De stem die je van deze systemen hoort is een combinatie van menselijke stem monsters en algoritmen die de illusie van vlotte toespraak creëren.
Erkenning van de stem
Stem herkenning systemen werken in de tegenovergestelde richting. Ze interpreteren een mens toespraak en het omzetten in tekst. Spraakherkenning systemen maken gebruik van een methode voor het interpreteren van een mens toespraak die is gebaseerd op kansberekening. Bijvoorbeeld, in een stelsel van erkenning van eenvoudige stem waar de enige aanvaardbare ingangen zijn "ja" of "nee", vermag de computer berekenen van de kans dat een gebruiker een of de ander zegt. Dit is mogelijk omdat het systeem van de erkenning van de stem kunt vergelijken het fonetische geluid van elke invoerwaarde tegen een database van monsters. Het principe is hetzelfde voor systemen met vele ingangen, hoewel de kans op fouten hoger is.
Tekst naar spraak
Tekst naar spraak is een technologie die mens herkenbare tekst converteert naar het fonetische equivalent daarvan, dan zet die om in geluid met behulp van de luidsprekers. Een groot deel van dit proces is betrokken met de interpretatie van de tekst en het breken in stukken. Elk stuk kan worden samengesteld van een aantal woorden, en afzonderlijke zinnen vertegenwoordigt. Op deze manier kan de text-to-speech engine toespraak dat natuurlijk aan menselijke luisteraars klinkt renderen. Deze eenheden opsplitsen geavanceerde text-to-speech motoren verder in afzonderlijke lettergrepen, compleet met toonhoogte en duur.