Skip to main content

Divu studentu radītais AI balss modelis izaicina Google NotebookLM

Divi universitātes studenti bez plašas pieredzes mākslīgā intelekta jomā ir izveidojuši atvērtā koda AI modeli, kas spēj ģenerēt podcastam līdzīgus audio ierakstus – līdzīgi kā Google NotebookLM. Šis jaunais risinājums varētu mainīt sintētiskās runas rīku tirgu, kurā dominē tādi spēlētāji kā ElevenLabs.

Neticami, bet patiesi: studentu izveidots AI

Jaunie izstrādātāji, kuru vārdi nav atklāti, apgalvo, ka viņu radītais modelis pēc funkcionalitātes var konkurēt ar Google NotebookLM, neskatoties uz to, ka abiem nav profesionālas pieredzes AI jomā. Šis projekts pierāda, ka inovatīvi risinājumi var rasties no visneaizskaramākajiem avotiem.

Kā tas strādā?

Modelis izmanto mašīnmācīšanās algoritmus, lai analizētu tekstu un pārveidotu to dabiskā, podcastam līdzīgā runā. Atšķirībā no daudziem komerciāliem risinājumiem, šis instruments ir brīvi pieejams un atvērtā koda, kas nozīmē, ka izstrādātāji visā pasaulē var to uzlabot un pielāgot savām vajadzībām.

Sintētiskās runas tirgus kļūst arvien sātīgāks

Pēdējo gadu laikā sintētiskās runas tehnoloģijas ir piedzīvojušas eksponenciālu attīstību. Tirgū jau dominē ElevenLabs, bet parādās arvien vairāk konkurentu, piemēram:

  • PlayAI
  • Sesame
  • Vairāki citi jaunpienācēji

Šis studentu projekts pievienojas šai sarakstam, piedāvājot unikālu pieeju un demokratizējot piekļuvi augstas kvalitātes runas ģenerēšanas tehnoloģijām.

Kāpēc tas ir nozīmīgi?

Atvērtā koda modeļi kā šis var:

  1. Samazināt barjeras tehnoloģiju attīstībā
  2. Veicināt inovācijas
  3. Dot iespējas mazākiem spēlētājiem

Nākotnes perspektīvas

Eksperti prognož, ka sintētiskās runas tirgus turpinās strauji augt, un šādi studentu projekti var kļūt par nozīmīgiem spēlētājiem. Lai gan pašlaik šis modelis vēl nav tik attīstīts kā komerciālie alternatīvi risinājumi, tā atvērtā pieeja un potenciāls izaicina tradicionālos uzņēmumus uzlabot savus produktus.

Ko šis nozīmē parastajiem lietotājiem?

Pateicoties šādiem projektiem, drīz vien ikviens varēs:

  • Izveidot profesionālus audio saturus
  • Pielāgot balss raksturlielumus
  • Automātizēt dažādus audio satura veidošanas procesus

Šis studentu veikums ir vēl viens piemērs tam, kā jaunieši ar radošu pieeju var mainīt tehnoloģiju pasauli, pat bez milzīgiem budžetiem vai profesionālas pieredzes. Nākotnē mēs noteikti dzirdēsim vēl daudz par šo projektu un tā radītājiem.

Avots: https://techcrunch.com/2025/04/22/two-undergrads-built-an-ai-speech-model-to-rival-notebooklm/

Atbildēt

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti kā *