โหมดตัวแทน

Gemini ในโหมดตัวแทนของ Android Studio ออกแบบมาเพื่อจัดการงานการพัฒนาที่ซับซ้อนและมีหลายขั้นตอน ซึ่งมากกว่าที่คุณจะได้รับจากการแชทกับ Gemini เพียงอย่างเดียว คุณสามารถอธิบายเป้าหมายระดับสูง แล้วตัวแทนจะสร้างและดำเนินการตามแผน เรียกใช้เครื่องมือที่จำเป็น ทำการเปลี่ยนแปลงในหลายไฟล์ และแก้ไขข้อบกพร่องซ้ำๆ เวิร์กโฟลว์ที่มีตัวแทนช่วยนี้จะช่วยให้คุณจัดการกับปัญหาที่ซับซ้อนได้ ซึ่งจะช่วยเร่งกระบวนการพัฒนา

ข้อกำหนดของระบบ

โหมดตัวแทนพร้อมให้ใช้งานใน Android Studio Narwhal Feature Drop Canary 4 เป็นต้นไป ดาวน์โหลด Android Studio เวอร์ชันตัวอย่างล่าสุด

เริ่มต้นใช้งาน

หากต้องการเริ่มต้นใช้งานในโหมดตัวแทนใน Android Studio ให้ทำตามขั้นตอนต่อไปนี้

  1. คลิก Gemini ในแถบด้านข้าง ลงชื่อเข้าใช้และเริ่มต้นใช้งานหากจำเป็น
  2. เลือกแท็บตัวแทน
  3. อธิบายงานที่ต้องการให้ตัวแทนดำเนินการ
  4. ขณะที่ตัวแทนดำเนินการตามขั้นตอนเพื่อทำงานให้เสร็จสมบูรณ์ คุณจะมีตัวเลือกในการตรวจสอบและอนุมัติการเปลี่ยนแปลง

    โหมดตัวแทนจะรอให้คุณยอมรับหรือปฏิเสธการเปลี่ยนแปลง
  5. ไม่บังคับ: หากต้องการอนุมัติการเปลี่ยนแปลงโดยอัตโนมัติ ให้เลือกตัวเลือกตัวแทน > อนุมัติการเปลี่ยนแปลงโดยอัตโนมัติ

    อนุมัติการเปลี่ยนแปลงที่ตัวแทนแนะนำโดยอัตโนมัติ

กรณีการใช้งาน

ตัวอย่างกรณีการใช้งานที่ตัวแทนสามารถช่วยเหลือคุณได้มีดังนี้

  • แก้ไขข้อผิดพลาดในการสร้าง เมื่อคุณขอให้ตัวแทนแก้ไขข้อผิดพลาดในการบิลด์โดยใช้พรอมต์ เช่น "แก้ไขข้อผิดพลาดในการบิลด์ในโปรเจ็กต์ของฉัน" ตัวแทนจะใช้การแก้ไขที่แนะนำ บิลด์โปรเจ็กต์เพื่อยืนยันวิธีแก้ปัญหา และดำเนินการซ้ำจนกว่าปัญหาจะได้รับการแก้ไข

    ตัวแทนจะสร้างโปรเจ็กต์และประเมินว่ามีข้อผิดพลาดหรือไม่
  • โหมดตัวแทนสามารถเพิ่มหรืออัปเดตองค์ประกอบ UI ได้ด้วยตัวเอง เช่น ขอให้ตัวแทน "ตั้งค่าโหมดมืดเป็นค่าเริ่มต้นในการตั้งค่าผู้ใช้" แล้วตัวแทนจะค้นหาไฟล์ที่เกี่ยวข้องและแนะนำการเปลี่ยนแปลงเพื่อให้งานเสร็จสมบูรณ์ คุณสามารถดูตัวอย่างการอัปเดต UI ได้ทันทีในหน้าต่างเครื่องมืออุปกรณ์ที่ใช้งานอยู่

  • การมีข้อมูลจำลองจะมีประโยชน์เมื่อสร้างต้นแบบและทดสอบแอป คุณมอบหมายงานดังกล่าวให้ตัวแทนได้แทนที่จะต้องสร้างข้อมูลจำลองด้วยตนเอง เราได้ขอให้ตัวแทน "เพิ่มเซสชันอีก 2 รายการลงในข้อมูลจำลอง" ระบบจะค้นหาไฟล์ที่เกี่ยวข้องและเพิ่มอีก 2 เหตุการณ์ลงในรายการ mockSessions

พรอมต์อื่นๆ ที่ลองใช้ได้มีดังนี้

  • "เขียนการทดสอบหน่วยสำหรับ <class> ใน <module>"
  • "สร้างเอกสารประกอบสำหรับไฟล์ที่เปิดอยู่ในปัจจุบัน"
  • "เปลี่ยนชื่อแอปจาก <ชื่อปัจจุบัน> เป็น <ชื่อใหม่>"
  • "แก้ไขข้อยกเว้น Null Pointer"
  • "Refactor โค้ดของฉันโดยย้ายคอมโพสิเบิล <composable name> ไปยังไฟล์ใหม่ ตรวจสอบว่าการนําเข้าทั้งหมดได้รับการอัปเดต"
  • "เพิ่มปุ่มใหม่ลงในหน้าจอหลักของแอปชื่อ "ติดตาม" ซึ่งจะนำคุณไปยังรายการหัวข้อ"
  • "ในคอมโพสิชัน <composable name> ให้ลดระยะห่างจากขอบของ <modifier name>"
  • "สร้างปุ่มแชร์เพื่อแชร์ไปยังโซเชียลมีเดีย"

เพิ่มคีย์ Gemini API

โหมดตัวแทนเริ่มต้นใน Android Studio มีโควต้ารายวันแบบไม่มีค่าใช้จ่ายที่มีกรอบเวลาบริบทที่จำกัด หากต้องการขยายหน้าต่างบริบท ให้เพิ่มคีย์ Gemini API ของคุณเองเพื่อใช้ประโยชน์จากโทเค็นได้สูงสุด 1 ล้านรายการด้วย Gemini 2.5 Pro

เพิ่มคีย์ API ของคุณเองเพื่อขยายกรอบบริบท

หน้าต่างบริบทที่ใหญ่ขึ้นจะช่วยให้คุณส่งวิธีการ โค้ด และไฟล์แนบได้มากขึ้นไปยัง Gemini ซึ่งจะทำให้คำตอบมีคุณภาพสูงขึ้น ซึ่งจะเป็นประโยชน์อย่างยิ่งเมื่อทำงานกับตัวแทน เนื่องจากบริบทที่มากขึ้นจะช่วยให้ Gemini 2.5 Pro สามารถหาเหตุผลเกี่ยวกับงานที่ซับซ้อนหรือใช้เวลานาน

วิธีรับคีย์ API

  1. ลงชื่อเข้าใช้ Google AI Studio แล้วรับคีย์โดยคลิกปุ่ม "รับคีย์ API"
  2. ใน Android Studio ให้ไปที่ไฟล์ (Android Studio ใน macOS) > การตั้งค่า > เครื่องมือ > Gemini เพื่อป้อนคีย์ API ของ Gemini
  3. เปิด Gemini อีกครั้งใน Android Studio เพื่อรับคำตอบที่ดีขึ้นจากโหมดตัวแทน
เพิ่มคีย์ API ของคุณเองในการตั้งค่า Gemini

โปรดรักษาคีย์ Gemini API ของคุณให้ปลอดภัยเนื่องจากจะมีการเรียกเก็บเงินเพิ่มเติมสำหรับการใช้งาน Gemini API ที่เชื่อมโยงกับคีย์ API ส่วนบุคคล คุณสามารถตรวจสอบการใช้คีย์ API ของ Gemini ใน AI Studio ผ่านรับคีย์ API > การใช้งานและการเรียกเก็บเงิน

เพิ่มเซิร์ฟเวอร์ MCP

ตัวแทนของ Gemini ใน Android Studio สามารถโต้ตอบกับเครื่องมือภายนอกได้โดยใช้ Model Context Protocol (MCP) ฟีเจอร์นี้ช่วยให้โหมดตัวแทนมีวิธีมาตรฐานในการใช้เครื่องมือ ตลอดจนขยายความรู้และความสามารถไปยังสภาพแวดล้อมภายนอก

คุณเชื่อมต่อกับโฮสต์ MCP ใน Android Studio ได้โดยใช้เครื่องมือหลายอย่าง เช่น คุณสามารถผสานรวมกับเซิร์ฟเวอร์ MCP ของ GitHub เพื่อสร้างคำขอดึงจาก Android Studio ได้โดยตรง ดูแนวคิดเพิ่มเติมได้ในหัวข้อเซิร์ฟเวอร์ตัวอย่าง MCP

หากต้องการเพิ่มเซิร์ฟเวอร์ MCP ให้สร้างไฟล์ mcp.json และวางไว้ในไดเรกทอรีการกําหนดค่าของ Studio ไฟล์ mcp.json ควรเป็นไปตามรูปแบบนี้

{
  "mcpServers": {
    "memory": {
      "command": "npx",
      "args": [
        "-y",
        "@modelcontextprotocol/server-memory"
      ]
    },
    "sequential-thinking": {
      "command": "npx",
      "args": [
        "-y",
        "@modelcontextprotocol/server-sequential-thinking"
      ]
    },
    "github": {
      "command": "docker",
      "args": [
        "run",
        "-i",
        "--rm",
        "-e",
        "GITHUB_PERSONAL_ACCESS_TOKEN",
        "ghcr.io/github/github-mcp-server"
      ],
      "env": {
        "GITHUB_PERSONAL_ACCESS_TOKEN": "<YOUR_TOKEN>"
      }
    }
  }
}

โปรดดูเอกสารประกอบของเซิร์ฟเวอร์ MCP ที่คุณกำลังผสานรวมเพื่อดู command และ args ที่แน่นอนซึ่งคุณควรระบุไว้ในไฟล์นี้ นอกจากนี้ คุณยังอาจต้องติดตั้งเครื่องมือต่างๆ เช่น Node.js หรือ Docker ทั้งนี้ขึ้นอยู่กับข้อกําหนดของซอฟต์แวร์เซิร์ฟเวอร์ MCP

ข้อจำกัด

การผสานรวม MCP ของ Android Studio มีข้อจํากัดที่สําคัญ 2-3 ข้อดังนี้

  • เซิร์ฟเวอร์ MCP ต้องใช้การขนส่ง stdio
  • ระบบยังไม่รองรับการนําส่ง HTTP แบบสตรีมมิง รวมถึงทรัพยากร MCP และเทมเพลตพรอมต์

วิธีการทํางานของตัวแทน

ในโหมดตัวแทน ระบบจะส่งพรอมต์ของคุณไปยัง Gemini API พร้อมรายการเครื่องมือที่ใช้ได้ คุณอาจมองเครื่องมือเป็นทักษะ ซึ่งรวมถึงความสามารถในการค้นหาไฟล์ อ่านไฟล์ ค้นหาข้อความภายในไฟล์ ใช้เซิร์ฟเวอร์ MCP ที่คุณกําหนดค่าไว้ และอื่นๆ

เมื่อคุณมอบหมายงานให้ Agent ทาง Agent จะสร้างแผนและพิจารณาว่าต้องใช้เครื่องมือใดบ้าง เครื่องมือบางอย่างอาจกำหนดให้คุณให้สิทธิ์ก่อนตัวแทนจึงจะใช้เครื่องมือได้ เมื่อคุณให้สิทธิ์แล้ว ตัวแทนจะใช้เครื่องมือดังกล่าวเพื่อดำเนินการที่จำเป็นและส่งผลลัพธ์กลับไปยัง Gemini API Gemini จะประมวลผลผลลัพธ์ของการดำเนินการและสร้างคำตอบอื่น วงจรการดำเนินการและการประเมินนี้จะดำเนินต่อไปจนกว่างานจะเสร็จสมบูรณ์