SpravodajstvoTechnológie

Umelá inteligencia od Googlu dokáže rozpoznávať hlasy ľudí v dave

Roboty a pokročilé technológie už vo viacerých oblastiach prekročili ľudské schopnosti. Najlepším príkladom je zrejme umelá inteligencia, ktorej schopnosti sú takmer nekonečné a nevyrovná sa jej už žiadny žijúci človek na tejto planéte. Umelá inteligencia ale nie je dokonalá v úplne všetkých oblastiach a jednou z takýchto oblastí je práve rozpoznávanie hlasov v dave ľudí. Pre nás sa nejedná o žiadnu náročnú úlohu a z davu ľudí sa viete celkom bezproblémovo zamerať na jednu vybranú osobu. Práve s touto problematikou sa momentálne zaoberajú výskumníci v spoločnosti Google, ktorí sa pýšia ďalším úspechom v oblasti umelej inteligencie.

Výskumníkom sa podarilo naučiť AI rozpoznávať hlasy v dave ľudí

Tím výskumníkov v Googli dokázal „vycvičiť“ model neurónovej siete s cieľom rozpoznať jednotlivé hovoriace osoby a následne vytvorili model virtuálnych hovoriacich „strán“, ku ktorým pridali hluk s pozadia. Týmto spôsobom vytvárania virtuálnych situácií naučili umelú inteligenciu izolovať viaceré hlasy od odlišných zvukových stôp. Výsledky tohto projektu môžete vidieť vo videu nižšie. Umelá inteligencia dokázala identifikovať hlasy aj napriek tomu, že sa dané osoby snažili navzájom prekrikovať. AI sa jednoducho zamerala na danú tvár osoby a následne dokázala identifikovať, čo táto osoba hovorí a akú zvukovú stopu ku nemu priradiť. V niektorých situáciách bola osoba na videu zakrytá, či už rukami alebo mikrofónom, no AI sa aj s týmto problémom vysporiadala.

Odoberajte Vosveteit.sk cez Telegram a prihláste sa k odberu správ

Potencionálne využitie tejto technológie je naozaj rozsiahle

Spoločnosť Google už v súčastnosti rozmýšľa nad implikáciou tejto technológie do svojich služieb, napríklad do aplikácií Hangouts alebo Duo. Táto technológia by výrazne vylepšila video-komunikáciu medzi osobami v prípade, že sa jedna z nich nachádza vo veľkej miestnosti s veľkým počtom ľudí. Aplikácia by na základe rozpoznávania tváre mohla zvyšovať audio rozprávajúceho, alebo by mohla vytvárať titulky. Využitie tejto technológie je naozaj rozsiahle a určite sa jedná o ďalší zásadný technologický posun, čo sa umelej inteligencie týka.

Zdroj: engadget.com, úvodný obrázok (Youtube)

Prihláste sa k odberu správ z Vosveteit.sk cez Google správy
Tagy
Zobraziť komentáre
Close
Close