Projekt Gutenberg udostępnia 5000 audiobooków wygenerowanych przez AI

Repozytorium otwartych książek Project Gutenberg, praktycznie z dnia na dzień, przekształciło tysiące swoich tytułów w audiobooki wykorzystując technologię syntetycznej mowy. Choć wybór jest nieco osobliwy, dla projektu to ogromny postęp w upowszechnianiu literatury.

Projekt Gutenberg udostępnia 5000 audiobooków wygenerowanych przez AI

Tworzenie audiobooka za pomocą tradycyjnej narracji jest kosztowne. Dla wielu tytułów taki nakład finansowy nie ma sensu, a to oznacza, że wiele starszych i mniej znanych książek pozostaje trudno dostępnych dla osób, które wybierają ten rodzaj lektury.

Projekt Gutenberg poświęcony jest propagowaniu literatury z domeny publicznej w jak największej liczbie formatów. Niestety wypełnienie luki w archiwum popularną czytaną formą było długo nieosiągalne. Dopiero po połączeniu sił z MIT i Microsoft twórcy repozytorium dokonali niemożliwego i wypracowali kod wykorzystujący mowę generowaną przez sztuczną inteligencję, która ożywił druk.

Największym problemem archiwum PG jest to, że pliki zebrane w bazie mają niejednolity format. Pochodzą z różnych źródeł, są obarczone błędami procesów optycznego rozpoznawania znaków i wolontariuszy, którzy często błędnie edytują i korygują lektury. Nawet po odczycie bezbłędnych cyfrowych wersji  papieru, otrzymalibyśmy narrację z numerami stron, przypisami i innymi efemerydami.

– Każda z e-książek w Projekcie Gutenberg zawiera szczególny format HTML z dużą ilością tekstu, który nie nadaje się do czytania na głos, takiego jak tabele, spisy treści, indeksy, numery stron itp. Najtrudniejszą częścią projektu było wydobycie dobrego tekstu do czytania na głos – wyjaśnił współlider projektu Mark Hamilton, związany z firmą Microsoft i MIT.

Pierwsza partia, będąca w pewnym stopniu ograniczona w swoim wyborze, jest nieco osobliwa. Jest tylko jedna książka Dickensa (niedokończony “Edwin Drood") i aż dziesięć tomów niepoczytnych biuletynów sprzed dwóch wieków.

– Wybraliśmy książki do pierwszej partii na podstawie tego, z czym naszym zdaniem automatyczny parser radzi sobie stosunkowo dobrze – kontynuuje Hamilton. – Niemniej jednak niektóre kluczowe tytuły zostały pominięte. Teraz, gdy mamy pierwszą partię gotową, pracujemy nad usprawnieniem systemu, żeby dobić do  60 tysięcy książek w kolejnej turze – dodaje.

Audiobooki Guttenberga udostępniono na Spotify, Apple Podcasts i Internet Archive, a kod używany do ich tworzenia jest udokumentowany na platformie GitHub.

)

Świetnie! Twoja rejestracja się powiodła.

Witaj z powrotem!

Twoja rejestracja w Digitized - magazyn dla ludzi w cyfrowym świecie zakończyła się sukcesem.

Sukces! Sprawdź swoje konto e-mail w poszukiwaniu magicznego linku do logowania.

Sukces! Twoje informacje rozliczeniowe zostały zaktualizowane.

Twoje informacje rozliczeniowe nie zostały zaktualizowane.