NanoIndicQA / mr
Overview
NanoIndicQA / mr is the Marathi split of IndicQA retrieval. The queries are Marathi reading-comprehension questions, and the documents are Marathi paragraphs that support the answer.
This task evaluates Marathi context retrieval in a compact QA-derived corpus. The model must retrieve the full evidence paragraph for a question, often where multiple questions share related historical, scientific, or biographical passages.
Details
What the Original Data Measures
IndicQA is a manually curated cloze-style reading-comprehension component of IndicXTREME, introduced in "Towards Leaving No Indic Language Behind". The retrieval adaptation uses each question as a query and the source context as the relevant document.
In the Marathi split, the task measures whether retrieval models can connect Marathi factual questions to their supporting Marathi paragraphs.
Observed Data Profile
This Nano split contains 200 queries, 250 documents, and 200 positive qrels. Each query has exactly one positive. Queries average 59.85 characters, and documents average 1,711.74 characters.
Observed examples ask about when Amartya Sen moved to West Bengal with his family, excavated stone-age tools, Ashoka's historical legacy, the last Hindu emperor to rule Delhi, and a statement about no society having the right to enslave another. Documents are long Marathi historical, biographical, political, and scientific paragraphs.
BM25 Evaluation Profile
BM25 reaches nDCG@10 of 0.4612, hit@10 of 0.5950, and recall@100 of 0.8400. The candidate pool contains the full 250-document corpus. BM25 is useful when named entities, dates, or distinctive terms are repeated.
The relatively low hit rate indicates that lexical overlap is not enough. Marathi questions may use different wording from the evidence sentence, and long paragraphs about related historical topics can share many terms.
Dense Evaluation Profile
The dense harrier-oss-270m profile reaches nDCG@10 of 0.6720, hit@10 of 0.8150, and recall@100 of 0.9700. Dense retrieval is the strongest direct profile.
This shows that semantic matching is important for Marathi IndicQA. Dense retrieval can connect a factual question to its context even when the exact terms are not repeated prominently.
Reranking Hybrid Evaluation Profile
The reranking_hybrid candidate subset reaches nDCG@10 of 0.5916, hit@10 of 0.7600, and recall@100 of 0.9650. It uses 100 candidates per query, with seven rank-101 safeguard positives.
Hybrid retrieval has strong candidate coverage but lower top-10 ranking than dense retrieval. It is useful for reranking, while dense retrieval is the better first-stage ranker in this split.
Metric Interpretation for Model Researchers
NanoIndicQA / mr is a dense-favored Marathi paragraph retrieval task. The difference between BM25 and dense retrieval is large enough to expose weak Marathi semantic representations.
Because each query has one positive, hit@10 and nDCG@10 are the key ranking metrics. Recall@100 is useful for measuring whether a candidate pool gives a reranker a chance to recover the correct paragraph.
Query and Relevance Type Tendencies
Queries are Marathi factual or cloze-style questions. Documents are long context paragraphs about history, biography, politics, science, and society.
The relevance relation is evidence support: the positive paragraph contains the information needed to answer the question.
Representative Failure Modes
BM25 may retrieve paragraphs with the same person, dynasty, or topic but not the requested fact. Dense retrieval may confuse semantically close history or biography paragraphs. Hybrid retrieval improves coverage but still requires precise evidence ranking.
When multiple questions target related contexts, paragraph-level topic matching can be insufficient for exact retrieval.
Training Data That May Help
Useful training data includes Marathi QA context retrieval, Marathi Wikipedia retrieval, multilingual IndicQA training, and hard negatives from the same science, history, biography, or political domains.
Training should exclude this split's questions and positive context paragraphs.
Model Improvement Notes
Improving this task requires Marathi semantic coverage and evidence-sensitive paragraph ranking. Models should preserve names, dates, titles, and factual relations while handling question-context paraphrase.
For reranking, the model should determine whether the paragraph contains the requested answer evidence, not only whether it covers the same broad topic.
Example Data
| Query | Positive document |
| कोणत्या वर्षी अमर्त्य सेन आपल्या कुटुंबासह पश्चिम बंगालला गेले? [63 chars] | अमर्त्य सेनचा जन्म बंगालमधील , ब्रिटिश भारतातील एका बंगाली हिंदू वैद्य कुटुंबात झाला होता. रवींद्रनाथ टागोर यांनी अमर्त्य सेन यांना त्याचे नाव दिले (बंगाली অমৃতत्य ortमॉर्टो, लिटर. "अमर"). सेन यांचे कुटुंबीय सध्याचे बांगलादेशमधील वारी आणि माणिकगंज, ढाका येथील होते. त्यांचे वडील आशुतोष अमर्त्य सेन ढाका विद्यापीठातील रसायनशास्त्र प्राध्यापक, दिल्लीतील विकास आयुक्त आणि तत्कालीन पश्चिम बंगाल लोकसेवा आयोगाचे अध्यक्ष होते. १९४५ मध्ये ते आपल्या कुटुंबासमवेत पश्चिम बंगालमध्ये गेले. सेनची आई अमिता सेन प्रख्यात संस्कृतवादी आणि रवींद्रनाथ टागोर यांचे निकटवर्तीय असलेल्या प्राचीन आणि मध्ययुगीन भारतातील अभ्यासक क्षिती मोहन सेन यांची मुलगी होती. के. एम. सेन यांनी १९५३ ते १९५४ दरम्यान विश्व भारती विद्यापीठाचे दुसरे कुलगुरू म्हणून काम पाहिले. सेन यांनी १९४० मध्ये ढाका येथील सेंट ग्रेगरी स्कूलमध्ये उच्च माध्यमिक शिक्षणाची सुरूवात केली. १९४१ च्या शेवटी, सेन यांनी शांतीनिकेतन येथे पाथ भवनात दाखल केले, जिथे त्यांनी शालेय शिक्षण पूर्ण केले, ज्यामध्ये त्यांनी उत्कृष्ट कामगिरी केली आणि आपल्या शाळेतील सर्वोच्च... [1,000 / 1,263 chars] |
| डेटिंगसाठी चुनखडीची साधने राज्यात उत्खनन केव्हा करण्यात आली? [61 chars] | 20,000 वर्षांपूर्वी डेटिंगसाठी अश्मयुगातील साधने राज्यात excavated गेले आहेत . [ 13 ] प्रदेश Vanga किंगडम , निवडणुक भारत प्राचीन राज्यांचे एक एक भाग होता . [ 14 ] Magadha राज्य होणारी , 7 शतक इ. स. पू. मध्ये स्थापना झाली बिहार आणि बंगाल प्रदेशाच्या . हे महावीर आणि बुद्ध वेळी भारत चार मुख्य राज्यांचे एक होता , आणि अनेक Janapadas , किंवा वैदिक realms / राज्यांचे च्या समावेश . [ 15 ] अनेक वैदिक realms Vanga , Rarh , Pundra व बंगाल प्रदेश , उपस्थित होते Suhma . मौर्य राजवंश च्या नियम दरम्यान , Magadha साम्राज्य अफगाणिस्तान आणि अशोका 3 शतक इ. स. पू. महान अंतर्गत पारस भाग समावेश प्रती दक्षिण आशियातील जवळजवळ सर्व विस्तारित . बंगालला लवकरात परदेशी संदर्भ एक सुमारे 100 बीसी प्राचीन ग्रीक द्वारे Gangaridai नावाच्या जमीन एक उल्लेख आहे . शब्द बंगाल क्षेत्र संदर्भात Gangahrd ( त्याच्या मनात गंगा जमीन ) येतात आहेत speculated आहे . [ 16 ] बंगाल आहे Sga ( ब्रह्मदेश , लोअर थायलंड , लोअर मलय द्वीपकल्प , आणि सुमात्रा ) सह भारताबाहेरील व्यापार संबंध होते . [ 17 ] Mahavamsa मते , विजया Singha , एक Vanga प्... [1,000 / 2,901 chars] |
| भारतीय इतिहासातील सर्वात महत्वाचा ऐतिहासिक वारसा कोणी दिला? [59 chars] | अशोकाने भारतीय इतिहासातील सर्वांत महत्त्वाचा ऐतिहासिक वारसा दिला म्हणजे त्याने त्याच्या राज्यात सर्वत्र लिहिलेले शिलालेख. अशोकाअगोदरच्या व नंतरच्या भारतीय राजांच्या फारश्या नोंदी आढळत नाहीत त्यामुळे तत्कालीन ऐतिहासिक मिळवणे जिकरीचे होते. अशोकाने आपल्या राज्याच्या सीमेवर महत्त्वाच्या शहरांमध्ये शिलालेखांद्वारे आपले विचार प्रकट केले आहेत. पुरातत्वशास्त्रज्ञांनुसार आजवर सापडलेल्या शिलालेखांपेक्षा अजून जास्त संख्येने अशोकाने शिलालेख बांधले असावेत व ते काळाच्या ओघात लुप्त झाले, अजूनही उत्खननांमध्ये स्तंभ व शिलालेख सापडण्याची शक्यता आहे. वर नमूद केल्याप्रमाणे अशोका संदर्भात बरीचशी माहिति शिलालेखांवरुन व स्तंभांवरुन आलेली आहे. अशोकाला मुख्यत्वे "देवानांपिय पियदसी" (पालीमध्ये) अथवा संस्कृतमध्ये प्रियदर्शी असा उल्लेख केला आहे. त्याचा अर्थ "देवांचा प्रिय व चांगले दाखविणारा" असा होतो. त्याच्या सर्व लेखांमध्ये त्याची महानता जाणवते, अशोकाने हे सर्व शिलालेख आपल्या साम्राज्यातील मार्गांवर मुख्य चौकांमध्ये स्थापित केले होते, जेणेकरून प्रजेला तसेच बाहेरच्या देशातून येणाऱ्याला अशोकाच्या राज्यातील आचारव... [1,000 / 1,012 chars] |
Source Reference Table
| Source | Role |
| Towards Leaving No Indic Language Behind | IndicXTREME and IndicQA benchmark paper. |
| mteb/IndicQARetrieval | MTEB retrieval task dataset card. |
| ai4bharat/IndicQA | Upstream IndicQA dataset card. |
| hakari-bench/NanoIndicQA | Nano benchmark dataset containing this split. |
Dataset Information
| Field | Value |
| Nano set | NanoIndicQA |
| Backing dataset | NanoIndicQA |
| Task / split | mr |
| Hugging Face dataset | hakari-bench/NanoIndicQA |
| Language | mr |
| Category | natural_language |
| Queries | 200 |
| Documents | 250 |
| Positive qrels | 200 |
| Positives / query avg | 1.00 |
| Positives / query min | 1 |
| Positives / query median | 1.00 |
| Positives / query max | 1 |
| Multi-positive queries | 0 (0.00%) |
| Query length avg chars | 59.85 |
| Document length avg chars | 1,711.74 |
Candidate Subsets
| Profile | Config | nDCG@10 | Hit@10 | Recall@100 | Candidates |
| BM25 | bm25 | 0.4612 | 0.5950 | 0.8400 | top-500 |
| Dense | harrier_oss_v1_270m | 0.6720 | 0.8150 | 0.9700 | top-500 |
| Reranking hybrid | reranking_hybrid | 0.5916 | 0.7600 | 0.9650 | top-100 |