Altavoz inteligente, ¿me estás escuchando a escondidas?
Rumores y verdad
"El año pasado, muchos de mis amigos me preguntaron sobre cuestiones de seguimiento antes de comprar altavoces inteligentes", dijo Zhang Sicheng. Ha trabajado en los departamentos de altavoces inteligentes de muchas empresas y sus amigos lo consideran un experto de la industria. "Lo que es más interesante es que después de preguntar, casi todos compraron el altavoz".
Según Zhang Sicheng y muchos profesionales que están familiarizados con los altavoces inteligentes, el trabajo de identificación de los altavoces inteligentes se divide en "local". En ambos casos, cuando el altavoz inteligente no está activo, funciona localmente. Aunque se recogerán sonidos externos, estos sonidos no se almacenarán ni se reconocerán semánticamente. "Antes de despertarse, equivale a realizar un trabajo de reconocimiento de ondas sonoras", dijo Xu Jiaming, "(los parlantes inteligentes) comparan los sonidos grabados con las palabras de activación. Cuando las ondas sonoras coincidan, se encenderán automáticamente". Jiaming es un gerente de producto de altavoces inteligentes.
Zhang Sicheng negó los rumores de "monitoreo secreto". Según su entendimiento, ninguno de los principales altavoces inteligentes domésticos del mercado tiene un monitoreo subjetivo y deliberado.
"Esto es algo muy costoso", cree Zhang Sicheng. Hizo un cálculo como este: supongamos que una empresa ha vendido 1 millón de parlantes en total y tiene 200.000 usuarios activos diarios. Si la empresa quiere activar estos parlantes para monitoreo las 24 horas, incluso si se generan 100.000 datos cada segundo, multiplíquelos por 200.000. , el costo acumulativo del ancho de banda de transmisión, el almacenamiento y la informática es asombroso.
Más importante aún, con las capacidades de procesamiento tecnológico actuales, las empresas aún son incapaces de transformar estas grabaciones enormes y fragmentadas en información efectiva con valor comercial. En opinión de Zhang Sicheng, incluso si no se considera el aspecto moral y sólo se consideran los intereses comerciales, las empresas no tienen ninguna motivación para recopilar información subjetiva.
Según recuerda Zhang Sicheng, en un proyecto de prueba de altavoces inteligentes dirigido por el Ministerio de Industria y Tecnología de la Información el año pasado, la cantidad de datos transmitidos por cada altavoz inteligente en estado no despierto fue solo del nivel KB. Para datos de voz, esta cantidad de datos es casi insignificante.
Lo que coincide más con los rumores de "escuchas" es el modo de funcionamiento de los altavoces inteligentes después de la "palabra de activación".
Tanto Zhang Sicheng como Xu Jiaming admitieron que una vez que el hablante se despierta, entrará en el estado de funcionamiento de la nube y transmitirá el sonido recopilado al servidor de la nube para completar el reconocimiento semántico del habla y la retroalimentación. "Esto es inevitable", dijo Zhang Sicheng con cierta impotencia. Mencionó que la potencia informática incorporada actual de los altavoces inteligentes no puede admitir cálculos semánticos del habla de tipo IA, y mucho menos mejorar las capacidades de reconocimiento local.
Para evitar fallas en la red y problemas de privacidad, la empresa de Zhang Sicheng ha proporcionado soluciones de voz que solo operan localmente en una inteligencia integral personalizada por el cliente. Sin embargo, esto hará que la funcionalidad sea muy única y solo admita comandos fijos. Por ejemplo, después de que el propietario regrese a casa, puede decirle al asistente de voz que "encienda la luz", pero si se reemplaza por "encienda esta luz". , no lo reconocerá.
Según la estrategia de producto de los altavoces inteligentes, cuando el usuario finaliza el comando y no aparece ningún sonido nuevo en unos segundos, la máquina volverá al estado de suspensión. "Cada marca tiene configuraciones diferentes, algunas son de 3 segundos, otras de 5 segundos", reveló Xu Jiaming. Sin embargo, en el trabajo real, debido a la madurez general limitada de los altavoces inteligentes, pueden producirse errores tanto en el "despertar" como en el "dormir". "Por ejemplo, sucede que hay un sonido similar a la palabra de despertador, o hay otros sonidos después de que finaliza el comando, lo que hace que el altavoz inteligente piense que necesita continuar funcionando, por lo que continuará recopilando sonidos, y el usuario No es consciente de esto". Según sus especulaciones, incluida Si Lan, en China, los llamados "incidentes de escuchas ilegales" encontrados por muchos usuarios se derivan de este tipo de motivo.
Según muchos profesionales, la "tasa de falsos despertares" ideal actual en la industria de los altavoces inteligentes es de aproximadamente 2 veces cada 48 horas, y la peor situación es de 2 a 3 veces cada 24 horas. Sin duda significa una mayor frecuencia de las llamadas "escuchas ilegales" en caso de uso indebido. "Para cada marca, lo más importante en este momento es mejorar las capacidades de IA y reducir las operaciones incorrectas. El corpus recopilado es el mejor material de capacitación", mencionó Xu Jiaming.
Extraído de "Tecnología para todo clima"