Vai DeepSeek izmantoja Google Gemini savas jaunākās AI modeļa apmācībai? Pētnieki izteikuši aizdomas
Pagājušajā nedēļā Ķīnas laboratorija DeepSeek prezentēja atjauninātu savas R1 argumentācijas AI modeļa versiju, kas uzrāda iespaidīgus rezultātus matemātikas un programmēšanas testos. Tomēr uzņēmums nav atklājis, kādi dati tika izmantoti modeļa apmācībai, un daži AI pētnieki aizdomājas, ka daļa informācijas varētu nākt no Google jaunākās sistēmas – Gemini.
Kas ir DeepSeek R1 un kāpēc tas izraisa diskusijas?
DeepSeek R1 ir uz argumentāciju un loģiku vērsts mākslīgā intelekta modelis, kas specializēts sarežģītu matemātisko uzdevumu un koda rakstīšanas problēmu risināšanā. Tā jaunākā versija uzrādīja ievērojamus uzlabojumus, pārspējot daudzus līdzīgus modeļus starptautiskos testos. Taču tieši šī pēkšņā veiktspējas lēciena dēļ daudzi eksperti sāka aizdomāties par tā apmācības datu avotiem.
Google Gemini iespējamā loma
Vairāki neatkarīgi AI pētnieki ir izteikuši pieņēmumu, ka DeepSeek varētu būt izmantojis datus no Google Gemini – jaunākā Google AI modeļa. Šie pieņēmumi balstās uz vairākiem faktoriem:
- R1 pēkšņie uzlabojumi īpaši tajās jomās, kurās Gemini uzrāda izcilus rezultātus
- Līdzīgas kļūdas un reakciju modeļi, kas novērojami abos sistēmās
- Fakts, ka DeepSeek nav publicējis detalizētu informāciju par apmācības datu avotiem
Kāpēc datu avotu izvēle ir svarīga?
AI modeļu apmācībā izmantoto datu izcelsme kļūst arvien svarīgāka temats starptautiskajā tehnoloģiju kopienā. Šīs diskusijas pamatā ir vairāki būtiski aspekti:
1. Autortiesību jautājumi
Ja DeepSeek patiešām ir izmantojis Google Gemini datus bez atļaujas, tas varētu izraisīt juridiskas sekas. Lielie tehnoloģiju uzņēmumi kļūst arvien uzmanīgāki attiecībā uz savu intelektuālā īpašuma aizsardzību.
2. Konkurences tiesības
AI nozarē pastāv sīva konkurence, un datu kopu kvalitāte bieži vien ir noteicošais faktors modeļu veiktspējā. Ja viena uzņēmuma dati tiek izmantoti cita uzņēmuma produktu uzlabošanai, tas var radīt negodīgas konkurences apstākļus.
3. Pārvarēšanas iespējas
Datu apmaiņa un koplietošana varētu paātrināt AI attīstību kopumā, taču ir svarīgi, lai tas notiktu caur atklātiem un etiskiem kanāliem.
Kā DeepSeek reaģēja uz aizdomām?
Līdz šim DeepSeek nav sniedzis oficiālu komentāru par iespējamo Gemini datu izmantošanu. Uzņēmuma pārstāvji tikai apstiprinājuši, ka R1 modelis tika apmācīts, izmantojot “dažādus publiski pieejamus un licencētus datu avotus”, taču nav norādījuši konkrētus avotus.
AI pētnieku aprindās šī neskaidrība ir radījusi papildu diskusijas par nepieciešamību pēc lielākas caurspīdīgumas attiecībā uz lielo valodu modeļu apmācības metodēm.
Kādas varētu būt sekas, ja aizdomas apstiprinātos?
Ja tiks pierādīts, ka DeepSeek patiešām ir izmantojis Google Gemini datus bez atļaujas, tam varētu būt vairākas sekas:
- Juridiskas procedūras: Google varētu ierosināt tiesas prāvu par intelektuālā īpašuma pārkāpšanu.
- Reputācijas zaudēšana: DeepSeek varētu zaudēt uzticēšanos no sadarbības partneriem un investoriem.
- Industrijas regulējumi: Šāds gadījums varētu paātrināt stingrāku regulējumu ieviešanu AI nozarē.
- Tehnoloģiskās sekas: Google varētu mainīt pieeju savu AI modeļu datu aizsardzībai.
Kā šis gadījums ietekmēs AI nozares attīstību?
Neatkarīgi no tā, vai aizdomas par DeepSeek darbību apstiprināsies vai nē, šis gadījums jau tagad ir iedvesmojis plašāku diskusiju par datu ētiku AI attīstībā. Eksperti uzsver vairākus galvenos mācības punktus:
1. Caurspīdīguma nepieciešamība
AI pētniecības laboratorijām vajadzētu būt atklātākām par to, kādi dati tiek izmantoti to modeļu apmācībā.
2. Licencēšanas nozīme
AI nozarē ir jāizstrādā skaidrāki noteikumi par to, kā un kādos apstākļos var izmantot citu uzņēmumu radītus datus un modeļus.
3. Starptautiskā sadarbība
Šādi gadījumi uzsver nepieciešamību pēc globāliem standartiem AI attīstībā, īpaši ņemot vērā intensīvo konkurenci starp dažādām valstīm.
Kopumā DeepSeek un Google Gemini gadījums var kļūt par pagrieziena punktu AI nozares regulējumos, veicinot lielāku atbildību un caurspīdīgumu šajā strauji augošajā tehnoloģiju jomā.
Avots: https://techcrunch.com/2025/06/03/deepseek-may-have-used-googles-gemini-to-train-its-latest-model/