ساختن یک دموی هوش مصنوعی ساده است؛ ساختن سیستمی که در محیط واقعی و زیر بار دوام بیاورد، کار سختی است. تفاوت در مدل نیست، در فرآیند است.

مشکل اصلی: پایداری، نه مدل

در پروژه‌هایی مانند ارزیابی مدارک تحصیلی، چالش واقعی این بود که نتیجه باید قابل‌اتکا، قابل‌ممیزی و تکرارپذیر باشد. یک خروجی درست در دمو کافی نیست؛ سیستم باید هزاران بار درست عمل کند.

راه‌حل: حلقه ارزیابی-بازارزیابی

به‌جای تکیه بر یک مدل، فرآیند را در یک حلقه قرار می‌دهیم: استخراج، پیشنهاد، بررسی در برابر مجموعه مرجع و تأیید انسانی — هر گام با ردگیری ممیزی. این ساختار به ما اجازه می‌دهد مدل را وسط پروژه عوض کنیم، چون کیفیت را می‌سنجیم نه حدس می‌زنیم.

نتیجه؟ فرآیندی که شش روز کار دستی را به یازده دقیقه کاهش داد و در عمل، روزانه و قابل اعتماد کار می‌کند.