Microsoft zainwestował we francuski startup Mistral AI, VIGO Photonics może zbudować polską fabrykę półprzewodników, a PFR Ventures zasiliło 150 mln zł cztery polskie fundusze VC. Czym jeszcze żyliśmy w minionym tygodniu?
Francuski MistralAI wypuścił wersję beta swojego chatbota, Elon Musk pozwał OpenAI, a Google ma kolejne kłopoty. Czym jeszcze żyliśmy w minionym tygodniu?
Obawy polskich małych i średnich przedsiębiorców w 2024 r., Międzynarodowy Fundusz Walutowy ostrzega przed AI, a Revolutowi grożą wielomilionowe kary za naruszenia prywatności. Czym jeszcze żyliśmy w minionym tygodniu?
Projekt Gutenberg udostępnia 5000 audiobooków wygenerowanych przez AI
Repozytorium otwartych książek Project Gutenberg, praktycznie z dnia na dzień, przekształciło tysiące swoich tytułów w audiobooki wykorzystując technologię syntetycznej mowy. Choć wybór jest nieco osobliwy, dla projektu to ogromny postęp w upowszechnianiu literatury.
Tworzenie audiobooka za pomocą tradycyjnej narracji jest kosztowne. Dla wielu tytułów taki nakład finansowy nie ma sensu, a to oznacza, że wiele starszych i mniej znanych książek pozostaje trudno dostępnych dla osób, które wybierają ten rodzaj lektury.
Projekt Gutenberg poświęcony jest propagowaniu literatury z domeny publicznej w jak największej liczbie formatów. Niestety wypełnienie luki w archiwum popularną czytaną formą było długo nieosiągalne. Dopiero po połączeniu sił z MIT i Microsoft twórcy repozytorium dokonali niemożliwego i wypracowali kod wykorzystujący mowę generowaną przez sztuczną inteligencję, która ożywił druk.
Największym problemem archiwum PG jest to, że pliki zebrane w bazie mają niejednolity format. Pochodzą z różnych źródeł, są obarczone błędami procesów optycznego rozpoznawania znaków i wolontariuszy, którzy często błędnie edytują i korygują lektury. Nawet po odczycie bezbłędnych cyfrowych wersji papieru, otrzymalibyśmy narrację z numerami stron, przypisami i innymi efemerydami.
– Każda z e-książek w Projekcie Gutenberg zawiera szczególny format HTML z dużą ilością tekstu, który nie nadaje się do czytania na głos, takiego jak tabele, spisy treści, indeksy, numery stron itp. Najtrudniejszą częścią projektu było wydobycie dobrego tekstu do czytania na głos – wyjaśnił współlider projektu Mark Hamilton, związany z firmą Microsoft i MIT.
Pierwsza partia, będąca w pewnym stopniu ograniczona w swoim wyborze, jest nieco osobliwa. Jest tylko jedna książka Dickensa (niedokończony “Edwin Drood") i aż dziesięć tomów niepoczytnych biuletynów sprzed dwóch wieków.
– Wybraliśmy książki do pierwszej partii na podstawie tego, z czym naszym zdaniem automatyczny parser radzi sobie stosunkowo dobrze – kontynuuje Hamilton. – Niemniej jednak niektóre kluczowe tytuły zostały pominięte. Teraz, gdy mamy pierwszą partię gotową, pracujemy nad usprawnieniem systemu, żeby dobić do 60 tysięcy książek w kolejnej turze – dodaje.
Audiobooki Guttenberga udostępniono na Spotify, Apple Podcasts i Internet Archive, a kod używany do ich tworzenia jest udokumentowany na platformie GitHub.
Dokumentalistka i redaktorka telewizyjnych formatów. Praktyk mediów cyfrowych i algorytmów w technologii filmowej. Po latach w świecie audiowizualnym wraca do dziennikarstwa - w nowej, cyfrowej odsłonie.
Miłośniczka sztuki, szczególnie sztuki przetrwania.
Microsoft zainwestował we francuski startup Mistral AI, VIGO Photonics może zbudować polską fabrykę półprzewodników, a PFR Ventures zasiliło 150 mln zł cztery polskie fundusze VC. Czym jeszcze żyliśmy w minionym tygodniu?
Francuski MistralAI wypuścił wersję beta swojego chatbota, Elon Musk pozwał OpenAI, a Google ma kolejne kłopoty. Czym jeszcze żyliśmy w minionym tygodniu?
Obawy polskich małych i średnich przedsiębiorców w 2024 r., Międzynarodowy Fundusz Walutowy ostrzega przed AI, a Revolutowi grożą wielomilionowe kary za naruszenia prywatności. Czym jeszcze żyliśmy w minionym tygodniu?
NVIDIA zaprezentowała Chat with RTX, OpenAI – model Sora, a Google – Gemini 1.5. Tymczasem 17 lutego zaczął obowiązywać unijny Akt o Usługach Cyfrowych (DSA). Czym jeszcze żyliśmy w minionym tygodniu?
Nasza strona wykorzystuje jedynie niezbędne funkcjonalne ciasteczka (cookie). Cenimy Twoją prywatność i nie dołączamy zewnętrznych, śledzących ciasteczek. Więcej szczegółów w naszej polityce prywatności.