Deep Learning-basierte Vorhersage der Sprachqualität

Author:   Gabriel Mittag
Publisher:   Springer Fachmedien Wiesbaden
Edition:   1. Aufl. 2024
ISBN:  

9783031385865


Pages:   174
Publication Date:   12 November 2024
Format:   Hardback
Availability:   Not yet available   Availability explained
This item is yet to be released. You can pre-order this item and we will dispatch it to you upon its release.

Our Price $316.77 Quantity:  
Pre-Order

Share |

Deep Learning-basierte Vorhersage der Sprachqualität


Add your own review!

Overview

Dieses Buch zeigt, wie man die neuesten Methoden des maschinellen Lernens (Deep Learning) für die Vorhersage der Sprachqualität einsetzen kann. Der Autor zeigt, wie die jüngsten Fortschritte im Bereich des maschinellen Lernens für die Aufgabe der Sprachqualitätsvorhersage genutzt werden können und bietet eine eingehende Analyse der Eignung verschiedener Deep-Learning-Architekturen für diese Aufgabe. Der Autor zeigt dann, wie das resultierende Modell herkömmliche Sprachqualitätsmodelle übertrifft und zusätzliche Informationen über die Ursache einer Qualitätsbeeinträchtigung durch die Vorhersage der Sprachqualitätsdimensionen Rauschen, Färbung, Diskontinuität und Lautheit liefert.

Full Product Details

Author:   Gabriel Mittag
Publisher:   Springer Fachmedien Wiesbaden
Imprint:   Springer Vieweg
Edition:   1. Aufl. 2024
ISBN:  

9783031385865


ISBN 10:   3031385861
Pages:   174
Publication Date:   12 November 2024
Audience:   Professional and scholarly ,  Professional & Vocational
Format:   Hardback
Publisher's Status:   Forthcoming
Availability:   Not yet available   Availability explained
This item is yet to be released. You can pre-order this item and we will dispatch it to you upon its release.

Table of Contents

1.Einführung.- 2. Qualitätsbewertung der übertragenen Sprache - 3. Neuronale Netzwerkarchitekturen für die Vorhersage der Sprachqualität - 4. Doppelendige Sprachqualitätsvorhersage mit Siamesischen Netzen.- 5. Vorhersage von Sprachqualitätsdimensionen mit Multi-Task-Lernen - 6. Bias-Aware Loss für das Training aus mehreren Datensätzen.- 7. NISQA - Ein einseitiges Sprachqualitätsmodell.- 8. Schlussfolgerungen.- A. Datensatz-Zustandstabellen.- B. Dimensionshistogramme für Trainings- und Validierungsdatensätze.- Referenzen.

Reviews

Author Information

Gabriel Mittag erhielt seinen B.Sc. und M.Sc. in Elektrotechnik und Elektronik an der Technischen Universität Berlin. Während seines Masterstudiums verbrachte er zwei Semester an der RMIT University in Melbourne, Australien und beschäftigte sich vor allem mit biomedizinischer und Sprachsignalverarbeitung. Ab 2016 war er als wissenschaftlicher Mitarbeiter am Quality and Usability Lab der TU Berlin tätig und promovierte dort über die maschinelle lernbasierte Vorhersage von Sprachqualität. Im Mai 2021 begann Gabriel Mittag als Machine Learning Scientist bei Microsoft in Redmond, WA, USA.

Tab Content 6

Author Website:  

Customer Reviews

Recent Reviews

No review item found!

Add your own review!

Countries Available

All regions
Latest Reading Guide

Aorrng

Shopping Cart
Your cart is empty
Shopping cart
Mailing List