Skip to main content

Grok tērzēšanas robots tagad “redz” apkārtējo pasauli – ieskaties jaunajā vizuālajā funkcijā!

Mākslīgā intelekta pasaule ir guvusi vēl vienu revolucionāru sasniegumu! Elonam Maskam piederošā uzņēmuma xAI izstrādātā tērzēšanas platforma Grok tagad spēj ne tikai sarunāties, bet arī “redzēt” un analizēt apkārtējo vidi, izmantojot jūsu viedtālruņa kameru. Šis lieliskais uzlabojums, kas pazīstams kā Grok Vision, atver durvis uz pilnīgi jaunu mijiedarbības veidu ar tehnoloģijām.

Kas ir Grok Vision un kā tas strādā?

Grok Vision ir jaunākā xAI platformas funkcija, kas ļauj lietotājiem vērst savu viedtālruņa kameru uz jebkuru objektu – vai tas būtu produkts, norādes zīme, dokuments vai pat ainava – un uzdot jautājumus par to, ko redz. Sistēma reāllaikā analizē attēlu un sniedz atbildes, līdzīgi kā tas darbojas Google Gemini un ChatGPT vizuālajās funkcijās.

Piemēram, jūs varat:

  • Uzvest kameru uz pārtikas produkta un uzzināt tā sastāvdaļas
  • Nolasīt un tulkot svešvalodā uzrakstītu zīmi
  • Saņemt skaidrojumu par sarežģītu tehnisku diagrammu
  • Identificēt augus vai dzīvniekus, kurus redzat dabā

Kāpēc šī funkcija ir revolucionāra?

Atšķirībā no vienkāršas attēla atpazīšanas, Grok Vision izmanto xAI jaudīgos modeļus, lai nodrošinātu kontekstuāli bagātīgas atbildes. Tas nozīmē, ka sistēma ne tikai atpazīs objektu, bet arī spēs sniegt padziļinātu informāciju par to, atbildēt uz jūsu specifiskiem jautājumiem un pat ieteikt saistītus risinājumus.

Grok Vision salīdzinājumā ar konkurentiem

Kamēr Google Gemini un OpenAI ChatGPT jau piedāvā līdzīgas vizuālās funkcijas, Grok Vision iezīmējas ar vairākām unikālām īpašībām:

Funkcija Grok Vision Gemini/Google Lens ChatGPT
Reāllaika analīze ✔️ ✔️
Kontekstuālas atbildes ✔️ (plašāks konteksts) ✔️ ✔️
Integrācija ar X (Twitter) ✔️ (unikāla iezīme)
Elona Maskam raksturīgais “sarkasms” režīms ✔️ (opcionāli)

Kāds ir praktiskais pielietojums?

Iedomājieties šādus scenārijus:

Ceļojot

Atrodoties svešā valstī, jūs varat uzvest kameru uz ceļa zīmēm, ēdienkarti vai transporta sarakstiem, un Grok Vision ne tikai tulkos tekstu, bet arī sniegs praktiskus padomus par vietējām īpatnībām.

Mācībās

Studenti var fotografēt sarežģītas formulas vai diagrammas un saņemt detalizētus skaidrojumus, kas pielāgoti viņu zināšanu līmenim.

Ikdienā

Veikalā varat uzmest aci uz produkta sastāvdaļām un uzreiz uzzināt, vai tas atbilst jūsu uztura ierobežojumiem vai vēlmēm.

Kā sākt lietot Grok Vision?

Lai izmēģinātu šo jauno funkciju, jums ir nepieciešams:

  1. Būt X (bijušais Twitter) Premium+ abonentam
  2. Lejupielādēt jaunāko X lietotnes versiju
  3. Atvērt Grok čata sadaļu
  4. Nospiest kameru ikonu un dot atļauju piekļuvei kamerai
  5. Vērst kameru uz interesējošo objektu un uzdot jautājumu

Funkcija pašlaik ir pieejama tikai iOS ierīcēm, bet drīzumā paredzēts atjauninājums arī Android lietotājiem.

Privātuma un drošības apsvērumi

X un xAI uzsver, ka visi attēli, kas apstrādāti caur Grok Vision, tiek šifrēti un netiek glabāti ilgtermiņā. Tomēr lietotājiem ieteicams:

  • Neizmantot funkciju, fotografējot jutīgu informāciju
  • Pārskatīt atļaujas, ko piešķir lietotnei
  • Būt apzinātiem par savu vides kontekstu, izmantojot šo funkciju publiskās vietās

Nākotnes perspektīvas

Grok Vision ir tikai pirmais solis xAI vizuālās sapratnes attīstībā. Nākotnē mēs varam gaidīt:

  • Augstākas izšķirtspējas attēlu analīzi
  • 3D objektu atpazīšanu
  • Integrāciju ar papildu sensoru datiem (piemēram, attāluma mērīšana)
  • Vairāk kontekstuālu mijiedarbību ar fizisko pasauli

Kā teica Elonš Masks Grok Vision prezentācijā: “Mēs tikai sākam izgrauzt virspusējo slāni tam, ko mākslīgais intelekts varēs ‘redzēt’ un saprast nākotnē. Šis ir tikai sākums.”

Vai esat gatavi izmēģināt šo jauno tehnoloģiju? Dalieties savām pirmajām pieredzēm ar Grok Vision komentāros!

Avots: https://techcrunch.com/2025/04/22/xais-grok-chatbot-can-now-see-the-world-around-it/

Atbildēt

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti kā *