Cómo compartir entradas de audio

Por lo general, la entrada de audio proviene del micrófono integrado, un micrófono externo o una interfaz de audio conectada al dispositivo. La entrada de audio también puede provenir de una conversación telefónica.

En ocasiones, es posible que dos o más apps quieran "capturar" la misma entrada de audio. Incluso para diferentes tareas. Por ejemplo, algunas apps que reciben audio pueden estar "grabando", como una simple grabadora de voz, mientras que otras podrían estar "escuchando", como Asistente de Google o un servicio de accesibilidad que responde a comandos por voz.

En cualquier caso, esas apps quieren recibir entradas de audio. En esta página, usamos el término "captura" sin importar si una app está grabando o solo escuchando.

Si dos o más apps quieren capturar audio al mismo tiempo, puede haber un problema al entregar la señal de audio de la misma fuente a todas ellas. En esta página, se describe cómo el sistema Android comparte la entrada de audio entre varias apps que capturan audio.

Comportamiento en versiones anteriores a Android 10

Antes de Android 10, solo una app a la vez podía capturar la transmisión de audio de entrada. Si alguna app ya estaba grabando o escuchando audio, tu app podría crear un objeto AudioRecord, pero se mostrará un error cuando llames a AudioRecord.startRecording() y no comience la grabación.

Una excepción a esta regla fue cuando una app con privilegios (como Asistente de Google o un servicio de accesibilidad) tenía el permiso android.permission.CAPTURE_AUDIO_HOTWORD y usaba una fuente de audio de tipo HOTWORD. En ese caso, otra app podía empezar a grabar. Cuando eso sucedió, se cerró la app privilegiada y la nueva capturaba la entrada.

Se agregó un cambio más en Android 9: solo las apps que se ejecutan en primer plano (o un servicio en primer plano) podían capturar la entrada de audio. Cuando una app sin un servicio ni un componente de la IU en primer plano comenzó a capturar, la app seguía ejecutándose, pero recibe silencio, incluso si era la única app que capturaba audio en ese momento.

Comportamiento de Android 10

En las versiones anteriores a Android 10, el comportamiento es "por orden de llegada". Una vez que una app comienza a capturar audio, ninguna otra puede acceder a la entrada de audio hasta que se detenga la que está capturando audio.

Android 10 impone un esquema de prioridad que puede cambiar la transmisión de audio de entrada entre apps mientras se ejecutan. En la mayoría de los casos, si una app nueva adquiere la entrada de audio, la app que anteriormente estaba capturando seguirá ejecutándose, pero recibe silencio. En algunos casos, el sistema puede seguir entregando audio a ambas apps. A continuación, se explican las diversas situaciones de uso compartido.

Este esquema es similar a la forma en que el foco de audio controla varias apps que compiten por el uso de la salida de audio. Sin embargo, el foco de audio se administra con solicitudes programáticas para obtener y liberar el foco, mientras que el esquema de cambio de entrada que se describe aquí se basa en una política de priorización que se aplica automáticamente cada vez que una app nueva comienza a capturar audio.

Para la captura de audio, Android distingue dos tipos de apps:

  • Las apps "comunes" son instaladas por el usuario.
  • Las apps "privilegiadas" vienen preinstaladas en el dispositivo. Entre estas, se incluyen el Asistente de Google y todos los servicios de accesibilidad.

Además, una app recibe un trato diferente si usa una fuente de audio "sensible a la privacidad": CAMCORDER o VOICE_COMMUNICATION.

Las reglas de priorización para usar y compartir la entrada de audio son las siguientes:

  • Las apps privilegiadas tienen mayor prioridad que las comunes.
  • Las apps que tienen IU visibles en primer plano tienen mayor prioridad que las que están en segundo plano.
  • Las apps que capturan audio de una fuente sensible a la privacidad tienen mayor prioridad que las que no lo hacen.
  • Dos apps comunes no pueden capturar audio al mismo tiempo.
  • En algunas situaciones, una app privilegiada puede compartir la entrada de audio con otra app.
  • Si dos apps en segundo plano de la misma prioridad están capturando audio, la última que se inició tiene mayor prioridad.

Situaciones de uso compartido

Cuando dos apps intentan capturar audio, ambas pueden recibir la señal de entrada, o una de ellas puede silenciarse.

Hay cuatro situaciones principales:

  • Asistente y app común
  • Servicio de accesibilidad y app común
  • Dos apps comunes
  • Llamada de voz y app común

Asistente y app común

Asistente es una app con privilegios porque está preinstalada y tiene la función RoleManager.ROLE_ASSISTANT. Se trata de forma similar a cualquier otra app preinstalada con esta función.

Android comparte el audio de entrada según estas reglas:

  • Asistente puede recibir audio (sin importar si está en primer o segundo plano), a menos que otra app que use una fuente de audio sensible a la privacidad ya esté capturando contenido.

  • La app recibe audio, a menos que Asistente tenga un componente de IU visible en la parte superior de la pantalla.

Ten en cuenta que ambas apps reciben audio solo cuando Asistente está en segundo plano y la otra app no realiza capturas desde una fuente de audio sensible a la privacidad.

Servicio de accesibilidad y app común

Una AccessibilityService requiere una declaración estricta.

Android comparte el audio de entrada según estas reglas:

  • Si la IU del servicio está en la parte superior, tanto el servicio como la app reciben la entrada de audio. Este comportamiento ofrece funcionalidades como el control de una llamada de voz o la captura de video con comandos por voz.

  • Si el servicio no está en la parte superior, este caso se trata como el de dos apps comunes, que se explica a continuación.

Dos apps comunes

Cuando dos apps capturan contenido simultáneamente, solo una recibe audio, y la otra recibe silencio.

Android comparte el audio de entrada según estas reglas:

  • Si ninguna de las apps es sensible a la privacidad, la que tenga la IU en la parte superior recibirá audio. Si ninguna tiene una IU, la que haya iniciado la captura más reciente recibirá audio.
  • Si una de las apps es sensible a la privacidad, recibirá audio, y la otra recibirá silencio, incluso si tiene una IU en la parte superior o si comenzó a capturar contenido más recientemente.
  • Si ambas apps son sensibles a la privacidad, la que comenzó a capturar más recientemente recibirá audio, y la otra recibirá silencio.

Llamada de voz y app común

Una llamada de voz está activa si el modo de audio que muestra AudioManager.getMode() es MODE_IN_CALL o MODE_IN_COMMUNICATION.

Android comparte el audio de entrada según estas reglas:

Comportamiento de Android 11

Android 11 (nivel de API 30) observa el esquema de prioridad de Android 10 que se describió anteriormente. También proporciona métodos nuevos en AudioRecord, MediaRecorder y AAudioStream que habilitan e inhabilitan la capacidad de capturar audio de forma simultánea, sin importar el caso de uso seleccionado.

Los nuevos métodos son los siguientes:

Cuando setPrivacySensitive() es true, el caso de uso de captura es privado y ni siquiera un Asistente con privilegios puede realizar capturas simultáneamente. Esta configuración anula el comportamiento predeterminado que depende de la fuente de audio. Por ejemplo, VOICE_COMMUNICATION es privado de forma predeterminada, pero UNPROCESSED no lo es.

Cambios de configuración

Cuando varias apps capturan audio simultáneamente, solo una o dos están "activas" (recibiendo audio); las otras están silenciadas (recibiendo silencio). Cuando las apps activas cambian, el framework de audio puede reconfigurar las rutas de audio de acuerdo con estas reglas:

  • El dispositivo de entrada de audio para cada app activa puede cambiar (por ejemplo, de un micrófono integrado a un auricular Bluetooth conectado).
  • El preprocesamiento asociado a la app activa de mayor prioridad está habilitado. Se ignoran todos los demás procesamientos previos.

Dado que una app activa puede silenciarse cuando se activa una de mayor prioridad, puedes registrar un elemento AudioManager.AudioRecordingCallback en los objetos AudioRecord o MediaRecorder para recibir una notificación cuando cambie la configuración. Los posibles cambios podrían ser los siguientes:

  • Se silenció o dejó de silenciar la captura.
  • Cambió el dispositivo.
  • Cambió el preprocesamiento.
  • Cambiaron las propiedades de transmisión (tasa de muestreo, máscara de canal y formato de muestreo).

Debes llamar a AudioRecord.registerAudioRecordingCallback() antes de iniciar la captura. La devolución de llamada se ejecuta solo cuando la app está recibiendo audio y se produce un cambio.

El método onRecordingConfigChanged() muestra un AudioRecordingConfiguration que contiene el estado de captura de audio actual. Usa los siguientes métodos para obtener información sobre el cambio:

isClientSilenced()
Muestra verdadero si el audio que se le mostró al cliente está silenciado debido a la política de captura.
getAudioDevice()
Muestra el dispositivo de audio activo.
getEffects()
Muestra el efecto de procesamiento previo activo. Ten en cuenta que el efecto activo puede no ser el mismo que el que muestra getClientEffects() si el cliente no es la app activa con la prioridad más alta.
getFormat()
Muestra las propiedades del flujo. Ten en cuenta que los datos de audio reales que recibe el cliente siempre respetan el formato requerido que muestra getClientFormat(). El framework realiza automáticamente el remuestreo, el canal y la conversión de formato necesarios del formato utilizado en la interfaz de hardware al formato especificado por el cliente.
AudioRecord.getActiveRecordingConfiguration()
Muestra la configuración de registro activa.

Para obtener una vista general de todas las grabaciones activas en el dispositivo, llama a AudioManager.getActiveRecordingConfigurations().