• Nosotros
  • Publicidad
  • Políticas de Privacidad
  • Contacto
Nexxo News
  • Home
  • Tendencias
  • Tecnología
    • All
    • Mundo Android
    • Mundo APPLE
    • Mundo Xiaomi

    110 años después por fin sabemos qué hundió al ‘Endurance’ en el Antártico. El culpable no fue el hielo: fue mucho peor

    En Brasil la gente está cambiando las caipiriñas y cócteles por la cerveza. Y tienen un buen motivo: el metanol

    Algunos usuarios se librarán del aumento de Xbox Game Pass Ultimate: esto es lo que acaba de decir Microsoft

    Hace diez años parecía una quimera, hoy es una realidad: hay más electricidad renovable en el mundo que producida por carbón

    El lanzamiento de octubre de Apple empieza a tomar forma: iPad Pro y Mac parecen claros, pero podría haber algo más

    «Habría que demandar a Apple». El fenómeno TikTok que me obliga a dar explicaciones sobre mi nuevo iPhone 17 Pro Max

    • Mundo Android
    • Mundo APPLE
  • Inteligencia Artificial
  • Negocios
    • All
    • Agronegocios
    • Vinos

    Chau juguetería tradicional: la cadena logística que permite el nuevo consumo de juguetes

    La Semana del Torrontés de Altura: ¿qué lo hace único a 2.300 msnm?

    Silicon NOA: programa WISE inyecta capital humano femenino en la economía del conocimiento regional

    Un viaje más inteligente y sostenible: Rentennials implanta el carsharing como alternativa viable para recorrer salinas y la Quebrada

    Alianza estratégica en el NOA: Tucumán y Salta unirán fuerzas para potenciar la Economía del Conocimiento

    Orgullo tucumano: Tafí del Valle recibe el Premio FED como destino destacado de Argentina y se proyecta a la FIT 2025

    • Agronegocios
    • Vinos
  • Marketing

    Open AI destrona a SpaceX y se convierte en la Start-up más valiosa del mundo

    Silicon NOA: programa WISE inyecta capital humano femenino en la economía del conocimiento regional

    Un viaje más inteligente y sostenible: Rentennials implanta el carsharing como alternativa viable para recorrer salinas y la Quebrada

    Orgullo tucumano: Tafí del Valle recibe el Premio FED como destino destacado de Argentina y se proyecta a la FIT 2025

    Emprendimiento tucumano impulsa la producción regional: Famaillá lanza cerveza de arándano sin gluten

    La IA de Google te permite crear fotos estilo Polaroid con cualquier famoso, de forma gratuita

  • Noticias

    Chau juguetería tradicional: la cadena logística que permite el nuevo consumo de juguetes

    Alianza estratégica en el NOA: Tucumán y Salta unirán fuerzas para potenciar la Economía del Conocimiento

    El sector audiovisual despega: Tucumán inaugura «Visión Norte», el primer mercado del NOA con sello emprendedor

    Arrancó UNSTA Emprende, la gira de innovación y pone a Tucumán en el mapa de congresos nacionales

    El gobierno tucumano lanza un programa provincial para convertir a Tucumán en el polo cafetero argentino

    Avance clave en Argentina: Tucumán sanciona ley de incentivos fiscales para vehículos eléctricos e híbridos

  • Gamer

    Qué es el Monotributo Unificado que se aplicará en la Ciudad de Buenos Aires: qué implica, qué beneficios representa y cómo adherirse

    110 años después por fin sabemos qué hundió al ‘Endurance’ en el Antártico. El culpable no fue el hielo: fue mucho peor

    En Brasil la gente está cambiando las caipiriñas y cócteles por la cerveza. Y tienen un buen motivo: el metanol

    Algunos usuarios se librarán del aumento de Xbox Game Pass Ultimate: esto es lo que acaba de decir Microsoft

    Hace diez años parecía una quimera, hoy es una realidad: hay más electricidad renovable en el mundo que producida por carbón

    Se acabó hablar de «gota fría»: AEMET ya tiene la lista de nombres para las DANAs que realmente deben preocuparnos

    • Guias de Videojuegos
  • Aplicaciones

    Tucumán lanza Bonus Ticket, una plataforma que digitaliza y potencia a emprendedores y epymes del sector turístico

    Tucumán, el eje clave de DiDi en Argentina: US$160 Millones para impulsar su crecimiento y la economía local

    La carrera que soñabas podría estar desapareciendo: cómo la IA transforma el mercado laboral y qué significa para los jóvenes

    Onepass llega a Tucumán y revoluciona la manera de viajar en transporte público

    Basta de errores al escribir. Ahora la IA te ayudará a escribir tus mensajes de WhatsApp

    El fin de Whatsapp gratuito. Meta lanza anuncios dentro de la sección de Novedades

No Result
View All Result
  • Home
  • Tendencias
  • Tecnología
    • All
    • Mundo Android
    • Mundo APPLE
    • Mundo Xiaomi

    110 años después por fin sabemos qué hundió al ‘Endurance’ en el Antártico. El culpable no fue el hielo: fue mucho peor

    En Brasil la gente está cambiando las caipiriñas y cócteles por la cerveza. Y tienen un buen motivo: el metanol

    Algunos usuarios se librarán del aumento de Xbox Game Pass Ultimate: esto es lo que acaba de decir Microsoft

    Hace diez años parecía una quimera, hoy es una realidad: hay más electricidad renovable en el mundo que producida por carbón

    El lanzamiento de octubre de Apple empieza a tomar forma: iPad Pro y Mac parecen claros, pero podría haber algo más

    «Habría que demandar a Apple». El fenómeno TikTok que me obliga a dar explicaciones sobre mi nuevo iPhone 17 Pro Max

    • Mundo Android
    • Mundo APPLE
  • Inteligencia Artificial
  • Negocios
    • All
    • Agronegocios
    • Vinos

    Chau juguetería tradicional: la cadena logística que permite el nuevo consumo de juguetes

    La Semana del Torrontés de Altura: ¿qué lo hace único a 2.300 msnm?

    Silicon NOA: programa WISE inyecta capital humano femenino en la economía del conocimiento regional

    Un viaje más inteligente y sostenible: Rentennials implanta el carsharing como alternativa viable para recorrer salinas y la Quebrada

    Alianza estratégica en el NOA: Tucumán y Salta unirán fuerzas para potenciar la Economía del Conocimiento

    Orgullo tucumano: Tafí del Valle recibe el Premio FED como destino destacado de Argentina y se proyecta a la FIT 2025

    • Agronegocios
    • Vinos
  • Marketing

    Open AI destrona a SpaceX y se convierte en la Start-up más valiosa del mundo

    Silicon NOA: programa WISE inyecta capital humano femenino en la economía del conocimiento regional

    Un viaje más inteligente y sostenible: Rentennials implanta el carsharing como alternativa viable para recorrer salinas y la Quebrada

    Orgullo tucumano: Tafí del Valle recibe el Premio FED como destino destacado de Argentina y se proyecta a la FIT 2025

    Emprendimiento tucumano impulsa la producción regional: Famaillá lanza cerveza de arándano sin gluten

    La IA de Google te permite crear fotos estilo Polaroid con cualquier famoso, de forma gratuita

  • Noticias

    Chau juguetería tradicional: la cadena logística que permite el nuevo consumo de juguetes

    Alianza estratégica en el NOA: Tucumán y Salta unirán fuerzas para potenciar la Economía del Conocimiento

    El sector audiovisual despega: Tucumán inaugura «Visión Norte», el primer mercado del NOA con sello emprendedor

    Arrancó UNSTA Emprende, la gira de innovación y pone a Tucumán en el mapa de congresos nacionales

    El gobierno tucumano lanza un programa provincial para convertir a Tucumán en el polo cafetero argentino

    Avance clave en Argentina: Tucumán sanciona ley de incentivos fiscales para vehículos eléctricos e híbridos

  • Gamer

    Qué es el Monotributo Unificado que se aplicará en la Ciudad de Buenos Aires: qué implica, qué beneficios representa y cómo adherirse

    110 años después por fin sabemos qué hundió al ‘Endurance’ en el Antártico. El culpable no fue el hielo: fue mucho peor

    En Brasil la gente está cambiando las caipiriñas y cócteles por la cerveza. Y tienen un buen motivo: el metanol

    Algunos usuarios se librarán del aumento de Xbox Game Pass Ultimate: esto es lo que acaba de decir Microsoft

    Hace diez años parecía una quimera, hoy es una realidad: hay más electricidad renovable en el mundo que producida por carbón

    Se acabó hablar de «gota fría»: AEMET ya tiene la lista de nombres para las DANAs que realmente deben preocuparnos

    • Guias de Videojuegos
  • Aplicaciones

    Tucumán lanza Bonus Ticket, una plataforma que digitaliza y potencia a emprendedores y epymes del sector turístico

    Tucumán, el eje clave de DiDi en Argentina: US$160 Millones para impulsar su crecimiento y la economía local

    La carrera que soñabas podría estar desapareciendo: cómo la IA transforma el mercado laboral y qué significa para los jóvenes

    Onepass llega a Tucumán y revoluciona la manera de viajar en transporte público

    Basta de errores al escribir. Ahora la IA te ayudará a escribir tus mensajes de WhatsApp

    El fin de Whatsapp gratuito. Meta lanza anuncios dentro de la sección de Novedades

No Result
View All Result
Nexxo News
No Result
View All Result
Home Tecnología

Misión: evitar que tu chatbot te explique cómo construir un arma nuclear. Anthropic ha creado una herramienta específica para eso

Pablo E. Páez by Pablo E. Páez
22 agosto, 2025
in Tecnología
0 0
0
0
SHARES
0
VIEWS
Share on FacebookShare on Twitter

Misión: evitar que tu chatbot te explique cómo construir un arma nuclear. Anthropic ha creado una herramienta específica para eso

La inteligencia artificial ha pasado en pocos años de ser una curiosidad tecnológica a convertirse en un motor de transformación en múltiples ámbitos. Sin embargo, su enorme potencial también conlleva riesgos, y uno de los más graves —y menos visibles para el gran público— es el posible uso indebido de estos sistemas para facilitar el desarrollo de armamento, al democratizar el acceso a la información sobre el mismo.

En un contexto donde la información es poder, los modelos de lenguaje avanzados podrían, en teoría, guiar a criminales y organizaciones terroristas en aspectos técnicos relacionados con la proliferación nuclear. Esta preocupación ha dado pie a un proyecto pionero: una alianza entre Anthropic, empresa desarrolladora del modelo de lenguaje Claude, y la Administración Nacional de Seguridad Nuclear de Estados Unidos (NNSA), dependiente del Departamento de Energía, con el objetivo de crear un sistema de salvaguardias frente al mal uso nuclear de la IA.

Un problema de doble filo. La tecnología nuclear es intrínsecamente dual. Los mismos principios que permiten generar electricidad en un reactor también pueden aplicarse a la fabricación de armas atómicas. Esta ambigüedad convierte a la información nuclear en material extremadamente sensible.

El reto es aún mayor cuando hablamos de IA: los modelos de lenguaje, entrenados con grandes volúmenes de datos, podrían acabar respondiendo a preguntas técnicas de forma peligrosa. Aunque los casos de conversaciones de este tipo son raros, el riesgo es de alto impacto, pues afecta directamente a la seguridad nacional y global.

El experimento Anthropic–NNSA: un clasificador «antinuclear»

Para hacer frente a este desafío, Anthropic y la NNSA han co-desarrollado un clasificador especializado, una herramienta de IA que funciona de manera similar a los filtros de spam en el correo electrónico. En lugar de detectar publicidad no deseada, este clasificador distingue entre conversaciones benignas sobre energía nuclear, medicina o política, y aquellas que podrían indicar intentos de obtener información sensible sobre armamento nuclear.


Todas las grandes potencias están de acuerdo en que la IA no controle el botón rojo nuclear. Todas... menos una
En Genbeta

Todas las grandes potencias están de acuerdo en que la IA no controle el botón rojo nuclear. Todas… menos una

El proyecto se basó en un proceso de red teaming: durante un año, expertos de la NNSA sometieron al modelo Claude a pruebas con preguntas y escenarios hipotéticos, identificando patrones de riesgo. Con esa información, y mediante la generación de cientos de ejemplos sintéticos, se entrenó el clasificador. Los resultados fueron prometedores: en pruebas preliminares alcanzó una precisión superior al 96%, logrando detectar casi el 95% de consultas peligrosas sin producir falsos positivos.

Este equilibrio es fundamental: si el sistema fuese demasiado estricto, podría bloquear a estudiantes legítimos de ingeniería nuclear; si fuese demasiado laxo, correría el riesgo de facilitar la proliferación.

Recordemos, en cualquier caso, que el 5,2% de las conversaciones dañinas fueron etiquetadas como benignas

Comprobando su efectividad en el mundo real

El clasificador ya se ha desplegado de forma experimental en parte del tráfico de Claude, y los primeros resultados muestran que funciona más allá de los laboratorios. Sin embargo, el entorno real presentó matices inesperados: por ejemplo, durante un repunte de tensiones en Oriente Medio, varias conversaciones legítimas sobre actualidad nuclear fueron inicialmente marcadas como ‘de riesgo’.

El problema se corrigió gracias a un sistema de resúmenes jerárquicos, que revisa varias conversaciones juntas para identificar su contexto, y así discernir entre un interés periodístico o académico y un intento real de proliferación. Este hallazgo refleja una realidad clave: la seguridad de la IA no depende de una única herramienta, sino de la combinación de múltiples capas que se refuercen entre sí.

Pero, si bien la creación de un clasificador antinuclear marca un hito en la seguridad de la IA, lo cierto es que plantea una pregunta mayor: ¿pueden las medidas de mitigación evolucionar al mismo ritmo que el desarrollo tecnológico? Al fin y al cabo, los modelos de lenguaje evolucionan con rapidez, y cada nueva generación es más potente y versátil… y eso multiplica tanto sus beneficios como sus riesgos.

Por fortuna, el esfuerzo realizado no repercutirá únicamente en provecho de Claude: Anthropic planea compartir su investigación recurriendo al Frontier Models Forum, la coalición de grandes compañías que cofundó con Amazon, Meta, OpenAI, Microsoft y Google, posicionándolo como una referencia para modelos de IA del sector.

Vía | Axios

Imagen | Marcos Merino mediante IA

En Genbeta | Cualquiera puede ser ‘el nuevo Alcasec’: por menos de 200 euros, esta IA 100% creada por ciberdelincuentes hackeará por ti

–
La noticia

Misión: evitar que tu chatbot te explique cómo construir un arma nuclear. Anthropic ha creado una herramienta específica para eso

fue publicada originalmente en

Genbeta

por
Marcos Merino

.

Pablo E. Páez

Pablo E. Páez

Consultor, Asesor y ejecutor en proyectos referidos al Marketing Digital, Negocios e Ingeniería en Sistemas; en especial el área E-Business, Big Data & E-Commerce, con experiencias laborales tanto en comercio como en sistemas de información. Soy un apasionado de mi profesión, divertido, emprendedor y me gusta mucho conocer gente y trabajar en equipo. Destaco en mí, la calidad en lo que hago y la dedicación al cumplimiento de objetivos.

RelatedNoticias

Tecnología

110 años después por fin sabemos qué hundió al ‘Endurance’ en el Antártico. El culpable no fue el hielo: fue mucho peor

7 octubre, 2025
Tecnología

En Brasil la gente está cambiando las caipiriñas y cócteles por la cerveza. Y tienen un buen motivo: el metanol

7 octubre, 2025
Tecnología

Algunos usuarios se librarán del aumento de Xbox Game Pass Ultimate: esto es lo que acaba de decir Microsoft

7 octubre, 2025
Tecnología

Hace diez años parecía una quimera, hoy es una realidad: hay más electricidad renovable en el mundo que producida por carbón

7 octubre, 2025
Mundo APPLE

El lanzamiento de octubre de Apple empieza a tomar forma: iPad Pro y Mac parecen claros, pero podría haber algo más

7 octubre, 2025
Mundo APPLE

«Habría que demandar a Apple». El fenómeno TikTok que me obliga a dar explicaciones sobre mi nuevo iPhone 17 Pro Max

7 octubre, 2025
Nexxo News

Categorías

  • Agronegocios
  • Aplicaciones
  • APP
  • Gamer
  • Guias de Videojuegos
  • Inteligencia Artificial
  • Marketing
  • Mundo Android
  • Mundo APPLE
  • Mundo Xiaomi
  • Negocios
  • Noticias
  • Tecnología
  • Tendencias
  • TOP
  • Vinos
  • 1.5k Fans
  • 3k Followers
  • Nosotros
  • Publicidad
  • Políticas de Privacidad
  • Contacto

© 2025 Nexxo News Una empresa del Grupo One Page.

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result

© 2025 Nexxo News Una empresa del Grupo One Page.

Ir a la versión móvil