[1]

Olesia Khrapunova, “Unified Benchmark for Evaluating Performance, Bias, and Consistency in LLM Binary Question Answering”, IJC, vol. 56, no. 1, pp. 319–338, Dec. 2025, Accessed: Jul. 08, 2026. [Online]. Available: https://ijcjournal.org/InternationalJournalOfComputer/article/view/2470