Stop AI from Guessing: Appier Enables Agents to Assess Confidence Before Acting

Stop AI from Guessing: Appier Enables Agents to Assess Confidence Before Acting

PR Newswire


New Framework Boosts Reliability, Cost Efficiency, and Scalability for Enterprise AI

SINGAPORE, March 24, 2026 /PRNewswire/ — As an AI-native Agentic AI-as-a-Service (AaaS) company, Appier today announced its latest research paper, On Calibration of Large Language Models: From Response to Capability, as part of its ongoing investment in advanced AI innovation. The study introduces Capability Calibration[1]–a new framework designed to address the overconfidence and hallucination challenges of large language models (LLMs) by enabling AI systems to better assess their own ability to solve a given task.

https://mma.prnewswire.com/media/2688236/Appier_white_logo__blue_background_Logo.jpg

This research equips AI agents with a critical capability: estimating the likelihood of solving a problem before generating an answer. By introducing a quantifiable self-assessment mechanism, AI systems can make more reliable decisions and allocate computational resources more efficiently–improving the reliability, cost efficiency, and scalability of enterprise AI deployments.

From Response Accuracy to Problem-Solving CapabilityTraditional LLM calibration focuses on response-level confidence, estimating whether a single generated answer is correct. However, because LLM outputs are inherently stochastic, the same query may produce different responses across multiple attempts. Therefore, a single response often fails to reflect the model’s true capability.

In practice, organizations are less concerned with whether one answer is correct and more interested in whether a model can consistently solve the task. Appier’s capability calibration framework addresses this by shifting evaluation from single-response confidence to the model’s expected success rate for a given query. This moves the evaluation target from a single answer to the model’s broader problem-solving capability, providing a more practical measure of real-world performance.

Teaching AI Agents to «Know Their Limits»«AI agents should not only generate answers but also understand the limits of their own capabilities,» said Chih-Han Yu, CEO and Co-Founder of Appier. «With capability calibration, an agent can estimate its probability of success before responding and allocate resources intelligently. Simple queries can be handled quickly, while complex tasks can automatically leverage stronger models or additional compute. This transforms AI from a passive tool into a system that actively manages resources, optimizes costs, and improves decision quality–an essential foundation for scaling enterprise-grade AI agents.»

Experimental Results: High-Quality Calibration at Low CostThe research clarifies the theoretical relationship between capability calibration and traditional response calibration[2], and evaluates multiple confidence estimation approaches across three large language models and seven datasets covering knowledge-intensive and reasoning-intensive tasks. Methods tested include:

  • Verbalized confidence
    [3]: The model explicitly states its confidence, in text or as a percentage.
  • P(True)
    [4]: Estimates the probability that the answer is correct based on generation signals.
  • Linear probes
    [5]: Use internal model signals to assess whether it truly understands.

Results show that the linear probe method provides the best balance between cost and performance, with computational cost even lower than generating a single token while maintaining reliable confidence estimation.

Two Key Applications: Improving Inference Efficiency and Resource AllocationThe framework enables two practical use cases. First, pass@k[6] prediction, a widely used metric for evaluating LLMs in complex tasks. Capability-calibrated confidence estimates the probability that a model will produce at least one correct answer after k attempts, without actually generating multiple responses. Second, inference resource allocation, where computational resources are dynamically distributed based on predicted task difficulty. Harder problems receive more attempts, allowing more tasks to be solved within the same compute budget.

Building a Decision Foundation for Trustworthy AI AgentsCapability calibration enables AI agents to establish a stable and quantifiable confidence signal before taking action. This allows agents to determine whether they can solve a task independently, when to call external tools, and when to seek human assistance–helping AI systems operate more reliably in uncertain environments.

Advancing Capability Calibration to Power Agentic AI ApplicationsLooking ahead, Appier’s AI research team will continue advancing capability calibration by improving model evaluation methods and expanding the framework to applications such as model routing, human-AI collaboration, and trustworthy AI systems. Leveraging Appier’s deep expertise in AI and marketing technology, these research advances will be translated into product capabilities, accelerating the deployment of Agentic AI in advertising and marketing decision-making and helping enterprises operate more efficiently in an increasingly complex digital landscape.

About AppierAppier (TSE: 4180) is an AI-native Agentic AI as a Service (AaaS) company that empowers business decision-making with cutting-edge AdTech and MarTech solutions. Founded in 2012 with the vision of «Making AI Easy by making software intelligent,» Appier endeavors to help businesses turn AI into ROI with its Ad Cloud, Personalization Cloud, and Data Cloud solutions. Now Appier has 17 offices across APAC, the US and EMEA, and is listed on the Tokyo Stock Exchange. Visit www.appier.com for more company information, and visit ir.appier.com/en/ for more IR information.

[1] Capability Calibration – A method for evaluating an AI model’s overall problem-solving ability by estimating the probability that it will successfully answer a given query, rather than judging a
single response.

[2] Response Calibration – A traditional AI evaluation approach that measures a model’s confidence in the correctness of a single generated response.

[3] Verbalized Confidence – A method where the model explicitly states its confidence in the correctness of an answer in natural language, such as a percentage or confidence level.

[4] P(True) – A technique that estimates the probability that an answer is correct by analyzing the token probability distribution generated by the model.

[5] Linear Probe – A lightweight linear classifier trained on a model’s internal representations to analyze whether the model has learned specific knowledge or capabilities, and to estimate confidence.

[6] pass@k – A common AI evaluation metric estimating the probability that a model produces at least one correct answer within k attempts, reflecting the need to explore multiple reasoning paths in
complex tasks.

For media queries, please email [email protected]

Logo – https://mma.prnewswire.com/media/2688236/Appier_white_logo__blue_background_Logo.jpg

View original content:https://www.prnewswire.co.uk/news-releases/stop-ai-from-guessing-appier-enables-agents-to-assess-confidence-before-acting-302723087.html

contador

0 responses to “Stop AI from Guessing: Appier Enables Agents to Assess Confidence Before Acting

  1. Pingback: www.negociame.com
  2. Pingback: www.mirlobolsa.com
  3. Pingback: Depósitos Sobre Ruedas de Banesto
  4. Pingback: sacale el maximo rendimiento a tu nomina: nuevas ofertas
  5. Pingback: Domiciliar la nómina: nuevas ofertas | PRÉSTAMOS, HIPOTECAS Y CRÉDITOS
  6. Tengo varias preguntas sobre esto a ver si me podiais aclarar:
    -¿Puedo hacer un ingreso regular de 800 euros y me cobran 0euos de comisiones y mto.?
    -¿Puedo sacar el dinero cuando quiera?,¿todo ó tengo entendido que hay que mantener un mínimo de 100 euros los 30 meses?
    -No necesito pero me obligan a sacar una tarjeta de débito que me cuesta 11 euros el primer año y 22 euros la renovación, también otra de credito que me cuesta 0 euros el primer año y 35 euros la renovación.
    ¿Hay que mantenerlas 13 meses?
    ¿Puedo cancelar alguna de ellas desde el principio?
    ¿Puedo cancelar alguna de ellas antes de la renovación?
    ¿Hay alguna tarjeta de credito más barata?
    Aparte de la cuenta nómina he visto que también que para que te den la tv también se puede sacar una cuenta tarifa plana básica o personal, ¿sabeis algo de estas cuentas?¿que requisitos tienen?
    Muchas gracias a todos por responder

  7. Yo fui a informarme y te cuento. Únicamente admiten los ingresos regulares en el caso de que seas autónomo. Te abren una cuenta Tarifa Plana Cero que está exenta de comisiones y presenta alguna ventaja más. Sobre dejar un mínimo de saldo en la cuenta no es necesario, pero sí te obligan a mantener varias tarjetas durante los 30 meses con un coste aproximado de 100 euros anuales.

  8. hola buenas!
    me llamo javi y estoy dudando de que banco, me puede dar mas beficios, sin sorpresas por domiciliar la nomina, ya que llevo años en la caixa y no me da nada ningun beneficio. es mas me rechazan los prestamos que solicito, ni siquiera una targeta de credito, por alegan de que siempre esta a cero la cuenta, yo cuando cobro la nomina dejo el dinero para los pagos, y saco el resto, pues no me fio, de que un dia me quede sin dinero, ya que esta todo muy mal, corre riesgo mi dinero o mis ahorros en el banco?? muchas gracias y un cordial saludo.
    javi

  9. NO TE EXTRAÑE QUE NO TE DEN LOS PTMOS, PORQUE LO QUE VEN ES QUE NO TIENES CAPACIDAD DE AHORRO PORQUE SIEMPRE DEJAS LA CTA. EN MINIMOS, ASI NINGUN BANCO TE LO VA A CONCEDER. TAMBIEN ES VERDAD QUE LA CAIXA, COMO TANTAS OTRAS CAJAS, TIENE EL PUÑO CERRADO PARA LOS RIESGOS, PARA REMONTAR. NO TE PREOCUPES, QUE POR UNA NOMINA NO CREO QUE NINGUN BANCO SE COJA LAS MANOS. LOS QUE SE TIENEN QUE PREOCUPAR SON LOS QUE TIENEN DÉPÓSITOS Y FONDOS EN BANCOS DE DUDOSA ACTIVIDAD. LA GENTE SE PIENSA QUE PORQUE LES DEN UN 7% YA ES UN GRAN BANCO Y SE EQUIVOCAN. LO QUE LES PASA ES QUE EL BANCO DE ESPAÑA LES PRESTA EL DINERO MAS CARO Y POR ESO OPTAN POR CONSEGUIRLO EN EL MERCADO MONETARIO, Y SI EL BANCO DE ESPAÑA NO SE FIA DE ELLOS, VA Y SE FIA LA GENTE. QUE LOS BANCOS NOES LA ADMON PUBLICA, ABRAN OS OJOS.

  10. Hola , cuando vallais al banco queos dejen lo que hay que pagar de irpf y de iva sobre el valor de la tele ya que en la mayoria de bancos esto no lo dicen y luego llagan las sorpresas .A mi ya me ha pasado con la promoción del portatil y nunca me hablaros de esto . Cuidado

  11. Yo he estado calculando y la tele entre unas cosas y otras te sale sobre unos 250euros que tampoco regalan tanto .Hay oficinas en las que han dado la occión de poner un dinero a plazo fijo a 12meses de 9300euros o 6800euros a 18 meses.

  12. No es ningún chollo. Te obligan a contratar dos tarjetas de crédito que tienes que pagar porque las tienes que mantener 13 meses por lo menos y además llevan unos costes desproporcionados si las utilizas. En total, no usando las tarjetas y anulándolas una vez cumplidos los 13 meses puedes ahorrar unos 38 euros con respecto al precio de ese televisor en una gran superficie. Y además luego vendrá que te cobran para hacienda la retención correspondiente, por lo que probablemente incluso en las mejores condiciones te cueste más que si ahorras un poco y lña compras directamente.

  13. Creó que teneis toda la razón, que aqui no te regalan nada, ya que a mí me paso con unas sartenes que regalaban el banco bilbao, que al final entre el irpf y el descuento de Hacienda, al final me salieron caras, así es que no os tomen el pelo, que al final siempre esta la letra pequeña que es la que nos joroba, por no decir otra cosa.

  14. Yo saque el portatil y ahora me he sacado la TV LCD 32. Estas promos no hay que declararlas. No es obligado domiciliar nomina. Si, meter en la cuenta 800€ todos los meses en un margen de 10 dias. Cero matacero, pero cero,cero, cero de gastos de mantenimiento, ni por recibos, ni por el correo a casa, ni por transfer. Las tarjets gratis el 1er año. Resto fuera. Dadas de baja Menos la de debito. Banesto no pierde nada, ganar, gana clientes que es el proposito de esta promo. Precio de portatil y tv 32 en mercao unos 900€ los 2. En banest 197€. Los hay mejores, nos ha jodio! portatiles a 1200€, TV LCD 32 a 1000€. Señores, son lentejas. Relacion calida-precio-promo es cojonud…….Un saludit a los viandantes.

  15. Pingback: Banesto: 1.000 euros por domiciliar nómina
  16. Pingback: 1000 euros por dominiciliar nómina en Banesto
  17. Pingback: Domiciliar la nómina: nuevas ofertas
  18. Pingback: Banesto: Wii de regalo por domiciliar la nómina y tres recibos
  19. Pingback: Regalos por domiciliar nómina en Banesto
  20. hola , no se si llegara mi comentario pero os voi a esplicar. esto es el cuento de la abuela. mira yo tengo el portatil. y he cogio tab la tele, pero sabeis ke?, me ha pasado de todo. os esplico. primero me cobran 74 euros y 25 euros de unas tarjetas que yo no las he visto aparecer por mi casa , me cabreo con el banco. llamo y pido esplicaciones. me dicen que van en la promocion, nunca jamas nadie me informo de las tarjetas, no me devuelven el dinero. me cabreo y me dicen que llame aun numero de tefono para darlas de baja, se pasan los dias, intentamos darlas de baja. largas y larga, que si este numero de tefono que si el otro bla bla bla. conseguimos hablar y nos dicen que tenemos que cambiar el contrato a tarifa plana o no se ke historias, llamando al banco se pasan los dias, largas y largas. me cabreo y estoi por suspender todo, me dicen que si lo quiero cambiar y dar de baja las tarjetas que nunca he tenido. tengo que pagar comisiones cada seis meses de doce y pico euros, y que si no quiero que me cobren comisiones tengo que ir todos los meses al banco a hacerlo yo, ufffffffffff.aun hay mas. me dan de baja y me hacen la tarifa plana, se equivocan un monton de veces. me hacen pasar muchos cabreos.y al final cuando llego a casa me han cobrado 25, 50 euros. y llamo por telefono y se lo digo , me dicen claro por dar de baja la otra cuenta , la madre que los pario. ladrones. o sea os digo que la tele no sale regalada, se la cobran y muy bien cobrada , nadie da nada por nada. en cuento termine de pagar lo que debo quito todas las cuentas del banesto.espero que alguien me lea y que me conteste gracias .

  21. Banesto ha jodido a mi marido y a un amigo tambien. Para mi, despues de Banco de Andalucía son los peores. Y quieran creerlo o no ni la television ni el portátil te lo regalan.. como no cumplas cualquiera de las reglas te sancionan con 300 y pico de euros.. porque nos hemos mudado de casa y los recibos domiciados se cortaron «temporalmente» la sancion fue de mas de 300 euros.. y el cabreo q te llevas cuando ves lo q te han descontado y luego para ir a reclamarlos.. y como te tratan !! en fin.. espero que Banesto sea lo primero en undirse en el fin del mundo!!

  22. CHOLLO!!!!!!!!!JAJAJAJAJA…….NO ES NINGUN CHOLLO!!!!!!! te cobran 100 € de gastos de manipulacion, mas 150 € en tarjetas durante 2 años, mas 6 € mensuales de mantenimiento de cuenta durante 30 meses, total que pagas 630 Euros por un ordenador o una TV que su valor seguro que no llega a 500 €. Y encima si vas a cancelar la cuenta cuando cumples los 30 meses requeridos te hacen esperar dos horas para decirte que no tienen linea de telefono para dar de baja la cuenta, cosa que no para nunca cuando vas a contratarlo. Y del trato que dispensan….., es el mismo que si vas con un fajo de billetes de 500 € por los CO-JONES

  23. Banesto «premia», menuda falacia…
    No hay ningún banco que premie a nadie.
    BANESTO NECESITA NUESTRAS NÓMINAS, Y EN CUANTO VAS UN POCO JUSTO, COMO BUENOS JUDÍOS Y ÁVAROS QUE SON, TE ACOSAN Y MACHACAN, Y TE SACAN HASTA LAS ENTRAÑAS EN COMISIONES.
    DESPUÉS EL ESTADO APOYA A LOS BANCOS, CON LA EXCUSA DE QUE SI CAEN LOS BANCOS CAEMOS TODOS. LOS BANCOS NECESITAN UN BOICOT DE VEZ EN CUANDO, PARA QUE NO NOS RESTREGUEN POR LA CARA SUS BENEFICIOS.

  24. POR CIERTO, LO QUE MÁS FASTIDIA A UN BANCO ES UNA RECLAMACIÓN EN LA OFICINA DEL CONSUMIDOR Y OTRA AL BANCO DE ESPAÑA.
    ES POR DAR PISTAS…