Tryb agenta

Gemini w trybie agenta w Android Studio zostało zaprojektowane tak, aby obsługiwać złożone, wieloetapowe zadania programistyczne, które wykraczają poza możliwości zwykłego czatu z Gemini. Możesz opisać ogólny cel, a agent utworzy i wykonuje plan, wywołując niezbędne narzędzia, wprowadzając zmiany w wielu plikach i cyklicznie poprawiając błędy. Ten proces obsługiwany przez agenta umożliwia Ci rozwiązywanie skomplikowanych problemów i przyspieszanie procesu rozwoju.

Wymagania systemowe

Tryb agenta jest dostępny od wersji Android Studio Narwhal Feature Drop Canary 4. Pobierz najnowszą wersję testową Android Studio

Rozpocznij

Aby rozpocząć pracę w trybie agenta w Android Studio:

  1. Na pasku bocznym kliknij Gemini . W razie potrzeby zaloguj się i utwórz konto.
  2. Kliknij kartę Agent.
  3. Opisz zadanie, które ma wykonać agent.
  4. Gdy pracownik obsługi klienta będzie wykonywać czynności związane z rozwiązaniem problemu, będziesz mieć możliwość sprawdzenia i zatwierdzenia wszelkich zmian.

    Tryb agenta czeka na zaakceptowanie lub odrzucenie zmiany.
  5. Opcjonalnie: aby automatycznie zatwierdzać zmiany, wybierz Opcje agenta > Automatycznie zatwierdzaj zmiany.

    automatycznie zatwierdzać zmiany sugerowane przez agenta.

Przypadki użycia

Oto kilka przykładów przypadków użycia, w których może Ci pomóc agent:

  • Napraw błędy kompilacji. Gdy poprosisz agenta o naprawienie błędu kompilacji, korzystając z promptu takiego jak „Popraw błędy kompilacji w moim projekcie”, agent zastosuje zalecaną poprawkę, skompiluje projekt, aby sprawdzić rozwiązanie, i powtórzy tę czynność, aż problem zostanie rozwiązany.

    Specjalista tworzy projekt i sprawdza, czy nie ma w nim błędów.
  • Tryb agenta może samodzielnie dodawać i aktualizować elementy interfejsu. Jeśli na przykład poprosisz agenta o „ustawienie trybu ciemnego jako domyślnego w ustawieniach użytkownika”, ten wyszuka odpowiednie pliki i zaproponuje zmiany, które należy wprowadzić, aby wykonać to zadanie. Możesz od razu wyświetlić podgląd zmian w interfejsie w oknie narzędzia Urządzenia z uruchomionymi aplikacjami.

  • Podczas tworzenia prototypu i testowania aplikacji przydatne są dane testowe. Zamiast tworzyć je ręcznie, możesz zlecić to specjaliście. Tutaj poprosiliśmy pracownika obsługi klienta o dodanie do fałszywych danych 2 dodatkowych sesji. Znajduje odpowiedni plik i dodaje do listy mockSessions 2 kolejne zdarzenia.

Inne prompty do wypróbowania:

  • „Napisz testy jednostkowe dla klasy <class> w module <module>”.
  • „Generowanie dokumentacji dla aktualnie otwartego pliku”.
  • „Zmień tytuł aplikacji z <aktualna nazwa> na <nowa nazwa>”.
  • „Rozwiąż wyjątek wskaźnika o wartości null”.
  • „Zrefaktoryzuj mój kod, przenosząc kompozyt <composable name> do nowego pliku. Upewnij się, że wszystkie importy są zaktualizowane”.
  • „Dodaj do ekranu głównego aplikacji nowy przycisk „Obserwuj”, który przekieruje Cię do listy tematów”.
  • „W komponowalnym <composable name> zmniejsz odstęp w modyfikatorze <modifier name>”.
  • „Utwórz przycisk udostępniania, aby udostępnić treści w mediach społecznościowych”.

Dodawanie klucza interfejsu Gemini API

Domyślny tryb agenta w Android Studio ma bezpłatny dzienny limit z ograniczonym oknem kontekstowym. Aby rozszerzyć okno kontekstu, możesz dodać własny klucz Gemini API, aby korzystać z maksymalnie 1 mln tokenów w przypadku Gemini 2.5 Pro.

Aby rozwinąć okno kontekstu, dodaj własny klucz interfejsu API.

Większe okno kontekstu pozwala wysyłać więcej instrukcji, kodu i załączników do Gemini, co przekłada się na jeszcze wyższą jakość odpowiedzi. Jest to szczególnie przydatne podczas pracy z agentami, ponieważ większy kontekst umożliwia Gemini 2.5 Pro rozwiązywanie złożonych lub długotrwałych zadań.

Aby uzyskać klucz interfejsu API:

  1. Zaloguj się w Google AI Studio i uzyskaj klucz, klikając przycisk Pobierz klucz interfejsu API.
  2. W Android Studio kliknij Plik (Android Studio na komputerze Mac) > Ustawienia > Narzędzia > Gemini, aby wprowadzić klucz interfejsu Gemini API.
  3. Uruchom ponownie Gemini w Android Studio, aby uzyskać jeszcze lepsze odpowiedzi od Agenta.
Dodaj własny klucz interfejsu API w ustawieniach Gemini.

Pamiętaj, aby chronić klucz interfejsu Gemini API, ponieważ dodatkowe opłaty są naliczane za korzystanie z Gemini API powiązanego z osobistym kluczem API. Korzystanie z klucza interfejsu Gemini API możesz monitorować w AI Studio, wybierając Uzyskaj klucz interfejsu API > Użycie i płatności.

Dodawanie serwera MCP

Agent Gemini w Android Studio może wchodzić w interakcje z zewnętrznymi narzędziami za pomocą protokołu Model Context Protocol (MCP). Ta funkcja zapewnia standardowy sposób korzystania z narzędzi w ramach trybu agenta oraz rozszerza jego wiedzę i możliwości w środowisku zewnętrznym.

W Android Studio możesz połączyć się z hostem MCP za pomocą wielu narzędzi. Możesz na przykład zintegrować się z serwerem GitHub MCP, aby tworzyć żądania pull bezpośrednio w Android Studio. Więcej informacji znajdziesz w artykule Przykładowe serwery MCP.

Aby dodać serwer MCP, utwórz plik mcp.json i umieść go w katalogu konfiguracji w Studio. Plik mcp.json powinien mieć format:

{
  "mcpServers": {
    "memory": {
      "command": "npx",
      "args": [
        "-y",
        "@modelcontextprotocol/server-memory"
      ]
    },
    "sequential-thinking": {
      "command": "npx",
      "args": [
        "-y",
        "@modelcontextprotocol/server-sequential-thinking"
      ]
    },
    "github": {
      "command": "docker",
      "args": [
        "run",
        "-i",
        "--rm",
        "-e",
        "GITHUB_PERSONAL_ACCESS_TOKEN",
        "ghcr.io/github/github-mcp-server"
      ],
      "env": {
        "GITHUB_PERSONAL_ACCESS_TOKEN": "<YOUR_TOKEN>"
      }
    }
  }
}

Aby dowiedzieć się, jakie command i args należy podać w tym pliku, zapoznaj się z dokumentacją serwera MCP, z którym chcesz przeprowadzić integrację. W zależności od wymagań dotyczących oprogramowania serwera MCP może być też konieczne zainstalowanie narzędzi takich jak Node.js czy Docker.

Ograniczenia

Integracja MCP z Android Studio ma kilka ważnych ograniczeń:

  • Serwery MCP muszą implementować transport stdio.
  • Obsługa przesyłania strumieniowego HTTP, a także zasoby MCP i szablony promptów nie jest jeszcze dostępna.

Jak działa agent

W trybie agenta prompt jest wysyłany do interfejsu Gemini API wraz z listą dostępnych narzędzi. Narzędzia to umiejętności, które obejmują m.in. wyszukiwanie plików, czytanie plików, wyszukiwanie tekstu w plikach, korzystanie z dowolnych skonfigurowanych serwerów MCP.

Gdy zlecisz mu zadanie, najpierw opracuje plan i określa, jakich narzędzi potrzebuje. W przypadku niektórych z tych narzędzi może być konieczne przyznanie przez Ciebie uprawnień, aby agent mógł z nich korzystać. Gdy przyznasz uprawnienia, agent użyje narzędzia do wykonania niezbędnych działań i prześle wynik z powrotem do interfejsu Gemini API. Gemini przetwarza wynik działania i generuje kolejną odpowiedź. Ten cykl działania i oceny trwa do momentu ukończenia zadania.