Skip to main content

Vadlīnijas datu zinātnes aģenta izveidei: Koda ieviešana ar Gemini-2.0-Flash-Lite, Google API, Pandas un IPython.display interaktīvai datu analīzei

Praktiskais ceļvedis datu analīzes aģenta izveidei

Šajā pamācībā mēs demonstrējam, kā integrēt Python bibliotēku Pandas datu apstrādei ar Google Cloud ģeneratīvā mākslīgā intelekta iespējām, izmantojot google.generativeai pakotni un Gemini Pro modeli. Iestatot vidi ar nepieciešamajām bibliotēkām, konfigurējot Google Cloud API atslēgu un izmantojot IPython displeja funkcijas, kods sniedz soli pa solim pieeju datu zinātnes aģenta izveidei, kas analizē parauga pārdošanas datu kopu.

!pip install pandas google-generativeai --quiet

Vispirms mēs klusā režīmā instalējam Pandas un google-generativeai bibliotēkas, sagatavojot vidi datu apstrādei un AI-palīdzības analīzei.

import pandas as pd 
import google.generativeai as genai 
from IPython.display import Markdown

Mēs importējam Pandas datu apstrādei, google.generativeai, lai piekļūtu Google ģeneratīvā AI iespējām, un Markdown no IPython.display, lai attēlotu makdona formātētus izvadus.

GOOGLE_API_KEY = "Ievadiet savu API atslēgu šeit" 
genai.configure(api_key=GOOGLE_API_KEY) 
 

model = genai.GenerativeModel('gemini-2.0-flash-lite')

Mēs piešķiram viettura API atslēgu, konfigurējam google.generativeai klientu ar to un inicializējam ‘gemini-2.0-flash-lite’ GenerativeModel satura ģenerēšanai.

data = {'Product': ['Laptop', 'Mouse', 'Keyboard', 'Monitor', 'Webcam', 'Headphones'], 
        'Category': ['Electronics', 'Electronics', 'Electronics', 'Electronics', 'Electronics', 'Electronics'], 
        'Region': ['North', 'South', 'East', 'West', 'North', 'South'], 
        'Units Sold': [150, 200, 180, 120, 90, 250], 
        'Price': [1200, 25, 75, 300, 50, 100]} 
sales_df = pd.DataFrame(data) 
 

print("Parauga pārdošanas dati:")
print(sales_df)
print("-" * 30)

Šeit mēs izveidojam Pandas DataFrame ar nosaukumu sales_df, kas satur parauga pārdošanas datus dažādiem produktiem, un pēc tam izdrukājam DataFrame, kam seko atdalošā līnija, lai vizuāli atšķirtu izvadi.

def ask_gemini_about_data(dataframe, query): 
    """ 
    Uzdod Gemini Pro modelim jautājumu par doto Pandas DataFrame. 
 
Argumenti: 
    dataframe: Pandas DataFrame analīzei. 
    query: Dabiskās valodas jautājums par DataFrame. 

Atgriež: 
    Gemini Pro modeļa atbildi kā virkni. 
""" 
prompt = f"""Tu esi datu analīzes aģents. Analizē šādu pandas DataFrame un atbildi uz jautājumu. 

DataFrame: 
``` 
{dataframe.to_markdown(index=False)} 
``` 

Jautājums: {query} 

Atbilde: 
""" 
response = model.generate_content(prompt) 
return response.text</code></pre></div></div>

Šeit mēs veidojam makdona formātā sagatavotu uzvedni no Pandas DataFrame un dabiskās valodas vaicājuma, pēc tam izmantojam Gemini Pro modeli, lai ģenerētu un atgrieztu analītisku atbildi.

# 1. vaicājums: Kāds ir kopējais pārdoto vienību skaits visos produktos? 
query1 = "Kāds ir kopējais pārdoto vienību skaits visos produktos?" 
response1 = ask_gemini_about_data(sales_df, query1) 
print(f"1. jautājums: {query1}") 
print(f"Atbilde 1:\n{response1}") 
print("-" * 30)

1. vaicājuma izvade

# 2. vaicājums: Kuram produktam bija vislielākais pārdoto vienību skaits? 
query2 = "Kuram produktam bija vislielākais pārdoto vienību skaits?" 
response2 = ask_gemini_about_data(sales_df, query2) 
print(f"2. jautājums: {query2}") 
print(f"Atbilde 2:\n{response2}") 
print("-" * 30)

2. vaicājuma izvade

# 3. vaicājums: Kāda ir produktu vidējā cena? 
query3 = "Kāda ir produktu vidējā cena?" 
response3 = ask_gemini_about_data(sales_df, query3) 
print(f"3. jautājums: {query3}") 
print(f"Atbilde 3:\n{response3}") 
print("-" * 30)

3. vaicājuma izvade

# 4. vaicājums: Parādiet produktus, kas pārdoti 'North' reģionā. 
query4 = "Parādiet produktus, kas pārdoti 'North' reģionā." 
response4 = ask_gemini_about_data(sales_df, query4) 
print(f"4. jautājums: {query4}") 
print(f"Atbilde 4:\n{response4}") 
print("-" * 30)

4. vaicājuma izvade

# 5. vaicājums: Sarežģītāks vaicājums - aprēķiniet kopējos ieņēmumus katram produktam. 
query5 = "Aprēķiniet kopējos ieņēmumus (Units Sold * Price) katram produktam un parādiet tos tabulā." 
response5 = ask_gemini_about_data(sales_df, query5) 
print(f"5. jautājums: {query5}") 
print(f"Atbilde 5:\n{response5}") 
print("-" * 30)

5. vaicājuma izvade

Noslēgumā pamācība veiksmīgi parāda, kā sinerģija starp Pandas, google.generativeai pakotni un Gemini Pro modeli var pārveidot datu analīzes uzdevumus interaktīvākā un informatīvākā procesā. Šī pieeja vienkāršo datu vaicāšanu un interpretāciju, kā arī atver iespējas sarežģītākiem lietojumiem, piemēram, datu tīrīšanai, pazīmju inženierijai un izpētes datu analīzei.


Šeit ir Colab piezīmju grāmatiņa. Neaizmirstiet arī sekot mums Twitter un pievienoties mūsu Telegram kanālam un LinkedIn grupai. Neaizmirstiet pievienoties arī mūsu 85k+ ML SubReddit.

https://www.marktechpost.com/

Atbildēt

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti kā *

© 2025 AI LATVIA