• Neuronautas
  • Posts
  • ✨ Voces que sienten: el salto emocional de la IA

✨ Voces que sienten: el salto emocional de la IA

Con etiquetas como [laughs] o [angry], Eleven v3 convierte texto en interpretación, ideal para medios creativos.

Del 2 al 9 de Junio

¿Qué es lo que se mueve?

  • 🎙️ Eleven v3 (alpha). El nuevo modelo de voz de ElevenLabs añade etiquetas para indicar emoción como [whispers] o [excited]. Logra un nivel de expresividad sin precedentes. Mira el video.

  • 🔌 Connectors en ChatGPT. Ahora puedes enlazar Drive, GitHub, SharePoint y más para buscar y citar tus propios archivos sin salir del chat.

  • 🚀 Gemini 2.5 Pro. Nueva versión de Gemini rompiendo rankings de razonamiento y estrena “presupuestos de pensamiento” para equilibrar costo y latencia.

  • 🐞 Cursor 1.0. BugBot para revisar PRs y proponer fixes con un clic, Background Agent para ejecutar tareas remotas, edición directa en Jupyter, y más.

  • 🛠️ Codex para usuarios Plus y con acceso a Internet. Ahora el agente puede instalar dependencias, correr tests externos y actualizar paquetes.

🔊 Eleven v3 (alpha): Nuevo modelo de voz superexpresivo

ElevenLabs acaba de lanzar la versión v3 (alpha) de su modelo Text-to-Speech (Texto a Voz), que lleva la expresividad de las voces sintéticas a otro nivel.

Ahora puedes combinar 70+ idiomas, cambiar de hablante sobre la marcha y añadir etiquetas como [whispers], [excited] o [sighs] para controlar tono y emociones al detalle.

Durante junio, usarlo en la web cuesta 80 % menos y la API pública llegará pronto.

Eleven v3 necesita más prompt engineering y tiene mayor latencia, así que para chatbots en tiempo real sigue con v2.5 Turbo/Flash.

  • 🎭 Audio tags: Ajusta susurros, gritos, risas o suspiros directamente en el guion.

  • 🗣️ Modo diálogo: Nuevo endpoint que arma conversaciones multivoz con interrupciones y ritmo natural.

  • 🌍 Cobertura global: 70+ lenguas mainstream listas para vídeos, audiolibros y accesibilidad.

  • Limitaciones hoy: Más lenta y menos fiable para uso en vivo; PVCs aún no optimizados.

Escucha la voz en este video.

🤝 Connectors: tu Drive, GitHub & más dentro de ChatGPT

Ahora el chatbot puede conectarse a tus fuentes de datos y buscarlas en tiempo real, desde un Doc en Drive hasta un PR en GitHub, sin salir de la conversación.

Piensa en un asistente que busca, cita y responde con la info exacta de tus propios archivos.

En esencia,

  • 🔌 Conecta más de 15 apps (Drive, SharePoint, Dropbox, Box, GitHub…) y consulta todo desde el chat.

  • 🧩 De cuatro maneras

    • Chat Search: búsquedas rápidas tipo “Encuentra el roadmap del Q2 en Drive”.

    • Deep Research: análisis pesado en proyectos complejos que requieren contexto de muchas fuentes.

    • Synced: genera índices de tus archivos para tener la información necesaria a la mano.

  • 🔒 Privacidad: Para los usuarios en planes individuales (Gratis/Plus/Pro), tu info se utilizara para entrenar a ChatGPT si la opción Improve the model for everyone está activada. Y viene por defecto, por lo que asegúrate de ir a desactivarla antes de

Por el momento, la mayoría de estas apps solo están disponibles en el modo Deep Research para los planes individuales.

Cómo empezar

  1. Settings → ConnectorsConnect

  2. Autentica tu cuenta externa

  3. En el chat: Tools → Search connectors o Run deep research

  4. Elige fuentes y pregunta. 📎 Dale clic a una cita para abrir el archivo original.

En resumen, Connectors convierte a ChatGPT en un buscador interno + analista sobre tus propios datos. Ideal para equipos que quieren respuestas con contexto real, sin cambiar de ventana.

🚀 Gemini 2.5 Pro: mejores rankings y nuevo “presupuesto de pensamiento”

Google liberó la versión previa de su modelo insignia antes del GA: escala benchmarks y da a los devs más control en costes/latencia.

Lo esencial

  • 📈 +24 pts en LMArena → 1470 y +35 pts en WebDevArena → 1443; sigue #1 en ambos rankings.

  • 👨‍💻 Líder en GPQA y HLE. Rankings en ciencia & razonamiento fuerte

  • ⚙️ “Presupuestos de Razonamiento” para ajustar los tokens exactos que utiliza el modelo en su razonamiento.

  • ✨ Respuesta más creativa y mejor formateada tras feedback de la versión de mayo.

  • 📲 Ya disponible en la app Gemini y en API; versión estable llega “en un par de semanas”.

Comienza a usarlo ya

from google import genai
from google.genai import types

client = genai.Client()

response = client.models.generate_content(
    model="gemini-2.5-pro-preview-06-05",
    contents="Provide a list of 3 famous physicists and their key contributions",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(thinking_budget=1024)
    ),
)

print(response.text)

Para programadores

🐞 Cursor 1.0: BugBot, agentes y Jupyter en piloto automático

La IDE con IA sube de versión y se convierte en un copiloto de código de tiempo completo: revisa PRs, corrige notebooks y hasta recuerda tus preferencias.

🆕 Lo esencial

  • 🤖 BugBot: Revisa tus pull requests, detecta bugs y propone el fix con un clic en “Fix in Cursor”.

  • ☁️ Background Agent para todos: ejecuta tareas asíncronas (linting, pruebas, despliegues) sin bloquear tu editor; se activa con el ícono de nube o Cmd/Ctrl+E.

  • 📓 Soporte en Jupyter: El agente crea y edita celdas: ideal para data science (solo con modelos Sonnet).

  • 🧠 Memories (beta): Guarda datos clave por proyecto y los usa en futuras conversaciones.

  • MCP one-click + OAuth: Instala y configura servidores MCP vía OAuth con un solo botón.

  • 🖼️ Respuestas Mejoradas: Diagramas Mermaid y tablas Markdown se renderizan directo en el chat.

  • 📊 Nuevo Dashboard: Analíticas de uso, stats por modelo/herramienta y ajustes pulidos.

Para más, consulta la documentación oficial.

🛠️ Codex ya para usuarios Plus

OpenAI amplió Codex para Plus, Pro y Team y ofrece acceso a Internet durante la ejecución. Según el anuncio, Codex con internet ahora puede:

  • Instalar paquetes pip, npm) sin salir del entorno.

  • Ejecutar tests que dependen de datos externos.

  • Actualizar dependencias automáticamente.

  • Control granular: define dominios y métodos HTTP permitidos para mitigar riesgos.

La función se activa al crear o editar un entorno y está desactivada por defecto.

Aunque en fase inicial, Internet Access convierte a Codex en un agente de desarrollo más autónomo y potente.

Quizás quieras ver esto,

  • 🧪 Apple descubrió que modelos como o3, Claude y DeepSeek R1 sufren caídas de precisión en tareas complejas y más bien empatan patrones que razonan.

  • 🎤 ChatGPT Voice se actualiza con traducción en vivo, mejor ritmo y entonación, facilitando atención al cliente y presentaciones en varios idiomas sin complicaciones.

  • ☁️ Google Colab ahora se conecta directo con Hugging Face para correr modelos instantáneamente, eliminando fricción en pruebas y despliegues sin salir del navegador.

Agenda de la Semana —
En colaboración con IAvanza

Cada semana, junto a IAvanza, destacamos eventos sobre
Inteligencia Artificial y emprendimiento para que
sigas creciendo con nosotros.
Conéctate, aprende y amplía tu red!

📌 Notion X AI
Webinar Gratuito impartido por Elier Fajardo
🗓 Martes, 10 de junio – 🕕 7:00 PM
🔗 Regístrate aquí: https://iavanza.do/formulario-webinar-semanal-iavanza

📌 Modelo Context Protocol (MCP): ¿qué es? y ¿para qué sirve?
Webinar Gratuito impartido por Jorge Vargas
🗓 Jueves, 12 de junio – 🕕 7:00 PM
🔗 Aparta tu cupo: https://iavanza.do/formulario-webinar-semanal-iavanza
🎯 Cupos limitados. No te quedes fuera.