HAKARI-Bench

NanoIndicQA / mr

Overview

NanoIndicQA / mr is the Marathi split of IndicQA retrieval. The queries are Marathi reading-comprehension questions, and the documents are Marathi paragraphs that support the answer.

This task evaluates Marathi context retrieval in a compact QA-derived corpus. The model must retrieve the full evidence paragraph for a question, often where multiple questions share related historical, scientific, or biographical passages.

Details

What the Original Data Measures

IndicQA is a manually curated cloze-style reading-comprehension component of IndicXTREME, introduced in "Towards Leaving No Indic Language Behind". The retrieval adaptation uses each question as a query and the source context as the relevant document.

In the Marathi split, the task measures whether retrieval models can connect Marathi factual questions to their supporting Marathi paragraphs.

Observed Data Profile

This Nano split contains 200 queries, 250 documents, and 200 positive qrels. Each query has exactly one positive. Queries average 59.85 characters, and documents average 1,711.74 characters.

Observed examples ask about when Amartya Sen moved to West Bengal with his family, excavated stone-age tools, Ashoka's historical legacy, the last Hindu emperor to rule Delhi, and a statement about no society having the right to enslave another. Documents are long Marathi historical, biographical, political, and scientific paragraphs.

BM25 Evaluation Profile

BM25 reaches nDCG@10 of 0.4612, hit@10 of 0.5950, and recall@100 of 0.8400. The candidate pool contains the full 250-document corpus. BM25 is useful when named entities, dates, or distinctive terms are repeated.

The relatively low hit rate indicates that lexical overlap is not enough. Marathi questions may use different wording from the evidence sentence, and long paragraphs about related historical topics can share many terms.

Dense Evaluation Profile

The dense harrier-oss-270m profile reaches nDCG@10 of 0.6720, hit@10 of 0.8150, and recall@100 of 0.9700. Dense retrieval is the strongest direct profile.

This shows that semantic matching is important for Marathi IndicQA. Dense retrieval can connect a factual question to its context even when the exact terms are not repeated prominently.

Reranking Hybrid Evaluation Profile

The reranking_hybrid candidate subset reaches nDCG@10 of 0.5916, hit@10 of 0.7600, and recall@100 of 0.9650. It uses 100 candidates per query, with seven rank-101 safeguard positives.

Hybrid retrieval has strong candidate coverage but lower top-10 ranking than dense retrieval. It is useful for reranking, while dense retrieval is the better first-stage ranker in this split.

Metric Interpretation for Model Researchers

NanoIndicQA / mr is a dense-favored Marathi paragraph retrieval task. The difference between BM25 and dense retrieval is large enough to expose weak Marathi semantic representations.

Because each query has one positive, hit@10 and nDCG@10 are the key ranking metrics. Recall@100 is useful for measuring whether a candidate pool gives a reranker a chance to recover the correct paragraph.

Query and Relevance Type Tendencies

Queries are Marathi factual or cloze-style questions. Documents are long context paragraphs about history, biography, politics, science, and society.

The relevance relation is evidence support: the positive paragraph contains the information needed to answer the question.

Representative Failure Modes

BM25 may retrieve paragraphs with the same person, dynasty, or topic but not the requested fact. Dense retrieval may confuse semantically close history or biography paragraphs. Hybrid retrieval improves coverage but still requires precise evidence ranking.

When multiple questions target related contexts, paragraph-level topic matching can be insufficient for exact retrieval.

Training Data That May Help

Useful training data includes Marathi QA context retrieval, Marathi Wikipedia retrieval, multilingual IndicQA training, and hard negatives from the same science, history, biography, or political domains.

Training should exclude this split's questions and positive context paragraphs.

Model Improvement Notes

Improving this task requires Marathi semantic coverage and evidence-sensitive paragraph ranking. Models should preserve names, dates, titles, and factual relations while handling question-context paraphrase.

For reranking, the model should determine whether the paragraph contains the requested answer evidence, not only whether it covers the same broad topic.

Example Data

QueryPositive document
कोणत्या वर्षी अमर्त्य सेन आपल्या कुटुंबासह पश्चिम बंगालला गेले? [63 chars]अमर्त्य सेनचा जन्म बंगालमधील , ब्रिटिश भारतातील एका बंगाली हिंदू वैद्य कुटुंबात झाला होता. रवींद्रनाथ टागोर यांनी अमर्त्य सेन यांना त्याचे नाव दिले (बंगाली অমৃতत्य ortमॉर्टो, लिटर. "अमर"). सेन यांचे कुटुंबीय सध्याचे बांगलादेशमधील वारी आणि माणिकगंज, ढाका येथील होते. त्यांचे वडील आशुतोष अमर्त्य सेन ढाका विद्यापीठातील रसायनशास्त्र प्राध्यापक, दिल्लीतील विकास आयुक्त आणि तत्कालीन पश्चिम बंगाल लोकसेवा आयोगाचे अध्यक्ष होते. १९४५ मध्ये ते आपल्या कुटुंबासमवेत पश्चिम बंगालमध्ये गेले. सेनची आई अमिता सेन प्रख्यात संस्कृतवादी आणि रवींद्रनाथ टागोर यांचे निकटवर्तीय असलेल्या प्राचीन आणि मध्ययुगीन भारतातील अभ्यासक क्षिती मोहन सेन यांची मुलगी होती. के. एम. सेन यांनी १९५३ ते १९५४ दरम्यान विश्व भारती विद्यापीठाचे दुसरे कुलगुरू म्हणून काम पाहिले. सेन यांनी १९४० मध्ये ढाका येथील सेंट ग्रेगरी स्कूलमध्ये उच्च माध्यमिक शिक्षणाची सुरूवात केली. १९४१ च्या शेवटी, सेन यांनी शांतीनिकेतन येथे पाथ भवनात दाखल केले, जिथे त्यांनी शालेय शिक्षण पूर्ण केले, ज्यामध्ये त्यांनी उत्कृष्ट कामगिरी केली आणि आपल्या शाळेतील सर्वोच्च... [1,000 / 1,263 chars]
डेटिंगसाठी चुनखडीची साधने राज्यात उत्खनन केव्हा करण्यात आली? [61 chars]20,000 वर्षांपूर्वी डेटिंगसाठी अश्मयुगातील साधने राज्यात excavated गेले आहेत . [ 13 ] प्रदेश Vanga किंगडम , निवडणुक भारत प्राचीन राज्यांचे एक एक भाग होता . [ 14 ] Magadha राज्य होणारी , 7 शतक इ. स. पू. मध्ये स्थापना झाली बिहार आणि बंगाल प्रदेशाच्या . हे महावीर आणि बुद्ध वेळी भारत चार मुख्य राज्यांचे एक होता , आणि अनेक Janapadas , किंवा वैदिक realms / राज्यांचे च्या समावेश . [ 15 ] अनेक वैदिक realms Vanga , Rarh , Pundra व बंगाल प्रदेश , उपस्थित होते Suhma . मौर्य राजवंश च्या नियम दरम्यान , Magadha साम्राज्य अफगाणिस्तान आणि अशोका 3 शतक इ. स. पू. महान अंतर्गत पारस भाग समावेश प्रती दक्षिण आशियातील जवळजवळ सर्व विस्तारित . बंगालला लवकरात परदेशी संदर्भ एक सुमारे 100 बीसी प्राचीन ग्रीक द्वारे Gangaridai नावाच्या जमीन एक उल्लेख आहे . शब्द बंगाल क्षेत्र संदर्भात Gangahrd ( त्याच्या मनात गंगा जमीन ) येतात आहेत speculated आहे . [ 16 ] बंगाल आहे Sga ( ब्रह्मदेश , लोअर थायलंड , लोअर मलय द्वीपकल्प , आणि सुमात्रा ) सह भारताबाहेरील व्यापार संबंध होते . [ 17 ] Mahavamsa मते , विजया Singha , एक Vanga प्... [1,000 / 2,901 chars]
भारतीय इतिहासातील सर्वात महत्वाचा ऐतिहासिक वारसा कोणी दिला? [59 chars]अशोकाने भारतीय इतिहासातील सर्वांत महत्त्वाचा ऐतिहासिक वारसा दिला म्हणजे त्याने त्याच्या राज्यात सर्वत्र लिहिलेले शिलालेख. अशोकाअगोदरच्या व नंतरच्या भारतीय राजांच्या फारश्या नोंदी आढळत नाहीत त्यामुळे तत्कालीन ऐतिहासिक मिळवणे जिकरीचे होते. अशोकाने आपल्या राज्याच्या सीमेवर महत्त्वाच्या शहरांमध्ये शिलालेखांद्वारे आपले विचार प्रकट केले आहेत. पुरातत्वशास्त्रज्ञांनुसार आजवर सापडलेल्या शिलालेखांपेक्षा अजून जास्त संख्येने अशोकाने शिलालेख बांधले असावेत व ते काळाच्या ओघात लुप्त झाले, अजूनही उत्खननांमध्ये स्तंभ व शिलालेख सापडण्याची शक्यता आहे. वर नमूद केल्याप्रमाणे अशोका संदर्भात बरीचशी माहिति शिलालेखांवरुन व स्तंभांवरुन आलेली आहे. अशोकाला मुख्यत्वे "देवानांपिय पियदसी" (पालीमध्ये) अथवा संस्कृतमध्ये प्रियदर्शी असा उल्लेख केला आहे. त्याचा अर्थ "देवांचा प्रिय व चांगले दाखविणारा" असा होतो. त्याच्या सर्व लेखांमध्ये त्याची महानता जाणवते, अशोकाने हे सर्व शिलालेख आपल्या साम्राज्यातील मार्गांवर मुख्य चौकांमध्ये स्‍थापित केले होते, जेणेकरून प्रजेला तसेच बाहेरच्या देशातून येणाऱ्याला अशोकाच्या राज्यातील आचारव... [1,000 / 1,012 chars]

Source Reference Table

SourceRole
Towards Leaving No Indic Language BehindIndicXTREME and IndicQA benchmark paper.
mteb/IndicQARetrievalMTEB retrieval task dataset card.
ai4bharat/IndicQAUpstream IndicQA dataset card.
hakari-bench/NanoIndicQANano benchmark dataset containing this split.

Dataset Information

FieldValue
Nano setNanoIndicQA
Backing datasetNanoIndicQA
Task / splitmr
Hugging Face datasethakari-bench/NanoIndicQA
Languagemr
Categorynatural_language
Queries200
Documents250
Positive qrels200
Positives / query avg1.00
Positives / query min1
Positives / query median1.00
Positives / query max1
Multi-positive queries0 (0.00%)
Query length avg chars59.85
Document length avg chars1,711.74

Candidate Subsets

ProfileConfignDCG@10Hit@10Recall@100Candidates
BM25bm250.46120.59500.8400top-500
Denseharrier_oss_v1_270m0.67200.81500.9700top-500
Reranking hybridreranking_hybrid0.59160.76000.9650top-100