Amharic Neural IR Models
Collection
Amharic Neural Information Retrieval models: Bi-Encoders, Cross Encoders, ColBERT, and SPLADE
•
9 items
•
Updated
This is a sentence-transformers model finetuned from rasyosef/roberta-medium-amharic. It maps sentences & paragraphs to a 512-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
SentenceTransformer(
(0): Transformer({'max_seq_length': 510, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
(1): Pooling({'word_embedding_dimension': 512, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("rasyosef/roberta-amharic-embed-medium")
# Run inference
sentences = [
'ድሬዳዋ አዲስ ምክትል ከንቲባ ተሾመላት',
'የድሬዳዋ ከተማ አስተዳደር ምክር ቤት የከተማዋን ከንቲባ የአቶ መሐዲ ጊሬን የመልቀቂያ ጥያቄ በመቀበል፣ የምክር ቤት አባል ያልሆኑትን አቶ አህመድ ቡህ ምክትል ከንቲባ በማድረግ ቃለ መሃላ አስፈጽሞ ሾመ፡፡ምክር ቤቱ ማክሰኞ ሐምሌ 16 ቀን 2011 ዓ.ም. ባካሄደው አስቸኳይ ጉባዔ፣ ከቀድሞው ከንቲባ አቶ ኢብራሂም ኡስማን ፋራህ በመጋቢት ወር ሥልጣን የተረከቡትን አቶ መሐዲን በአቶ አህመድ ተክቷል፡፡የቀድሞው ከንቲባ አቶ ኢብራሂም በወርኃ መጋቢት 2011 ዓ.ም. ድሬዳዋ ውስጥ በተፈጠረው ሁከት ምክንያት፣ የሦስት ዓመት ከስድስት ወራት ሥልጣናቸውን አስረክበው መልቀቃቸው ይታወሳል፡፡አቶ አህመድ ቡህ የድሬዳዋ ምክር ቤት አባል ባለመሆናቸው፣ በምክትል ከንቲባነት ድሬዳዋን እንደሚመሩ ታውቋል፡፡ይህ በዚህ እንዳለ ምክር ቤቱ የአፈ ጉባዔውን የአቶ አብደላ አህመድ መልቀቂያ በመቀበል፣ ወ/ሮ ፈጡም ሙስጠፋን አፈ ጉባዔ አድርጎ መሾሙን ለማወቅ ተችሏል፡፡የድሬዳዋ ከተማ አስተዳደር እንደ አዲስ አበባ ከተማ አስተዳደር ቻርተሩ ተሻሽሎ፣ አሁን በሥራ ላይ ያለው ምክር ቤት ሥራውን እንዲቀጥል በፓርላማ ከአንድ ዓመት በፊት መወሰኑ ይታወሳል፡፡',
'ድሬዳዋ ከተማ ወደ መረጋጋት እየተመለሰች በመሆኑ መደበኛ የስራ እንቅስቃሴው ወደ ነበረበት መመለሱን የከተማው ፖሊስ ኮሚሽን አስታወቀ።በመከላከያ ሰራዊት፣ በሌሎች የጸጥታ ኃይሎችና በህዝቡ ጥረት እየመጣ ያለውን ሰላም ለማስጠበቅ የምስራቅ ዕዝ መከላከያ ሠራዊት ወስዶ እየሰራ ይገኛል።የከተማው ፖሊስ ኮሚሽን ህዝብ ግንኙነት ዲቪዥን ኃላፊ ዋና ሳጅን ባንተአለም ግርማ እንደገለጹት ባለፉት አራት ቀናት ወጣቶች ሲያካሄዱት የነበረው የተቃውሞ ሰልፍና እሱን ተከትሎ የተከሰተው አለመረጋጋት ትላንትና ቆሟል፡፡ግርግሩን ተከትሎ በመንግስታዊና በግለሰብ ተቋማት ላይ መጠነኛ ጉዳት መድረሱን የገለጹት ኃላፊው በችግሩ መፈጠርና መባባስ የተጠረጠሩ ቀደም ሲል የተያዙትን ጨምሮ ሁለት መቶ ሰዎች በቁጥጥር ሥር መዋላቸውን ተናግረዋል።ለተፈጠረው አንጻራዊ ሰላምና መረጋጋት ወጣቱ ላሳየው ተሳትፎ ዋና ሳጅን ባንተአለም በኮሚሽኑ ስም አመስግነው በወጣቱ ጥያቄዎች ሰበብ ድብቅ አጀንዳዎችን የሚያራምዱ አካላትን ለህግ ለማቅረብ የጀመሩትን ጥረት እንዲቀጥሉ ጠይቀዋል።የድሬዳዋ አስተዳደር መንግስት ኮሚኒኬሽን ጉዳዮች ቢሮ ኃላፊ አቶ እስቂያስ ታፈሰ በበኩላቸው የምስራቅ ዕዝ መከላከያ ሠራዊት በከተማው ሰላምን የመጠበቅና የህግ የበላይነትን የማረጋገጥ ኃላፊነትን በበላይነት ተረክቦ እየሰራ ይገኛል ብለዋል፡፡በአሁኑ ሰዓት በተፈጠረው መረጋጋት መደበኛ እንቅስቃሴ በከተማው እየተከናወነ መሆኑን ገልፀው በቀጣይ የወጣቶቹን መሰረታዊ ጥያቄዎች መፍታት የሚያስችሉ ውይይቶች እንደሚደረጉ ተናግረዋል፡፡በከተማው ሰላምና መረጋጋት መፈጠሩ ቢረጋገጥም ትላንት በመልካ ጀብዱ ቀበሌ መጠነኛ ግጭት መታየቱን የቀበሌው ነዋሪዎች ገልፀዋል። (ኢዜአ)',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 512]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
dim_512InformationRetrievalEvaluator with these parameters:{
"truncate_dim": 512
}
| Metric | Value |
|---|---|
| cosine_accuracy@1 | 0.6681 |
| cosine_accuracy@3 | 0.8061 |
| cosine_accuracy@5 | 0.843 |
| cosine_accuracy@10 | 0.8883 |
| cosine_precision@1 | 0.6681 |
| cosine_precision@3 | 0.2687 |
| cosine_precision@5 | 0.1686 |
| cosine_precision@10 | 0.0888 |
| cosine_recall@1 | 0.6681 |
| cosine_recall@3 | 0.8061 |
| cosine_recall@5 | 0.843 |
| cosine_recall@10 | 0.8883 |
| cosine_ndcg@10 | 0.7794 |
| cosine_mrr@10 | 0.7444 |
| cosine_map@100 | 0.7479 |
dim_256InformationRetrievalEvaluator with these parameters:{
"truncate_dim": 256
}
| Metric | Value |
|---|---|
| cosine_accuracy@1 | 0.6605 |
| cosine_accuracy@3 | 0.7996 |
| cosine_accuracy@5 | 0.8409 |
| cosine_accuracy@10 | 0.8831 |
| cosine_precision@1 | 0.6605 |
| cosine_precision@3 | 0.2665 |
| cosine_precision@5 | 0.1682 |
| cosine_precision@10 | 0.0883 |
| cosine_recall@1 | 0.6605 |
| cosine_recall@3 | 0.7996 |
| cosine_recall@5 | 0.8409 |
| cosine_recall@10 | 0.8831 |
| cosine_ndcg@10 | 0.7736 |
| cosine_mrr@10 | 0.7382 |
| cosine_map@100 | 0.7419 |
anchor, positive, negative_1, and negative_2| anchor | positive | negative_1 | negative_2 | |
|---|---|---|---|---|
| type | string | string | string | string |
| details |
|
|
|
|
| anchor | positive | negative_1 | negative_2 |
|---|---|---|---|
በኢትዮጵያ የሚንቀሳቀሱ የቱርካውያን ትምህርት ቤቶች ለቱርክ መንግሥት እንደሚተላለፉ ፕሬዚዳንት ሙላቱ አስታወቁ |
በኢትዮጵያ ላለፉት 12 ዓመታት ሲንቀሳቀሱ የቆዩትንና በቱርክ መንግሥት አሸባሪ ከተባለው የጉለን ንቅናቄ ጋር ግንኙነት አላቸው የተባሉ የቱርካውያን ባለሀብቶች ትምህርት ቤቶችን፣ ለቱርክ መንግሥት አሳልፎ እንደሚሰጥ ፕሬዚዳንት ዶ/ር ሙላቱ ተሾመ አስታወቁ፡፡ፕሬዚዳንት ሙላቱ በቱርክ ለአምስት ቀናት በነበራቸው ይፋዊ ጉብኝት ወቅት ከቱርክ ፕሬዚዳንት ሬሲፕ ጠይብ ኤርዶዋን ጋር በሰጡት መግለጫ፣ መንግሥታቸው ከጉለን እንቅስቃሴ ጋር ንክኪ ያላቸውን ትምህርት ቤቶች አሳልፎ እንደሚሰጥና ከቱርክ መንግሥት ጋር እንደሚተባበር ገልጸዋል፡፡ መንግሥት ከቱርክ ጎን በመቆም ሽብርተኝትን ለመታገል ለምታደርገው እንቅስቃሴ ድጋፉን እንደሚሰጥ የተናገሩት ፕሬዚዳንት ሙላቱ፣ በኢትዮጵያ የሚንቀሳቀሱት የቱርካውያን ትምህርት ቤቶች ማሪፍ ፋውንዴሽን ለተባለው መንግሥታዊ የቱርክ ተቋም ተላልፈው እንደሚሰጡ ማረጋገጫ ሰጥተዋል፡፡የቱርክ መንግሥት በሐምሌ ወር ለተቃጣበት የግልበጣ ሙከራ ቀንደኛ ተጠያቂ ያደረጋቸው፣ በአሜሪካ በስደት የሚኖሩትንና የጉለን ንቅንናቄ ወይም የሂዝመን ንቅናቄ መሪ እንደሆኑ የሚነገርላቸውን ሞሐመድ ፌቱላህ ጉለንና ተከታዮቻቸውን ነው፡፡ የጉለን ንቅናቄ አባላትና ደጋፊዎች፣ በግልበጣ መኩራው ሳቢያ ለ248 ሰዎች መሞትና ለ2,000 ተጎጂዎች ተጠያቂ መደረጋቸው አይዘነጋም፡፡ የንቅናቄው አራማጆችና አባላት በመላው ዓለም ከሚንቀሳቀሱባቸው መንገዶች መካከል በንግድ፣ በትምህርት ተቋማትና በሌሎችም መስኮች ተፅዕኖ ለመፍጠር ሞክረዋል በማለት የቱርክ መንግሥት ሲወነጅል ቆይቷል፡፡ በመሆኑም ከቱርክ መንግሥት ጋር ዲፕሎማሲያዊ ግንኙነት ያላቸው አገሮች በሙሉ ንክኪ አላቸው በማለት የሚወነጅላቸው ትምህርት ቤቶችንም ሆኑ የንግድ ተቋማትን እንዲዘጉለት ሲወተውት ቆይቷል፡፡ኢትዮጵያም ይህ ጥያቄ ከቀረ... |
ቱርክመንኛ ቱርክመንኛ (Türkmen) የቱርክምኒስታን ብሔራዊ ቋንቋ ነው። በቱርክመኒስታን 3,430,000 ተናጋሪዎች ሲኖሩ ከቱርክመኒስታን ውጭ ደግሞ 3 ሚሊዮን የሚያሕሉ ተናጋሪዎች በተለይም በኢራን (2 ሚሊዮን) በአፍጋኒስታን (500,000) እና በቱርክ (1000) አሉ። ቱርክመንኛ በቱርኪክ ቋንቋ ቤተሰብ ውስጥ ይከተታል። ይህም አንዳንዴ በትልቁ አልታይ ቋንቋ ቤተሰብ ውስጥ ይደመራል። ቀድሞ የተጻፈበት ወይም በቂርሎስ ወይም በ አረብ ፊደሎች ነበር፤ አሁን ግን የቱርክመኒስታን መሪ ሳፓርሙራት ኒያዞቭ በላቲን ፊደል እንዲጻፍ አዋጀ። በ1994 አ.ም. ደግሞ የሳምንት ቀኖችና የወር ስሞች ሁሉ እንደ አቶ ኒያዞቭ "ሩህናማ" የሚባል ይፋዊ መጽሐፍ ፍልስፍና በአዋጅ ተቀየሩ። |
አዲስ አበባ፦ በኦሮሚያ ክልል በተመረጡ ትምህርት ቤቶች የሶማሊኛ ቋንቋ እንደ ተጨማሪ የቋንቋ ትምህርት መሰጠት ተጀመረ። የሶማሌ ቴሌቪዥን እንደዘገበው በቅርቡ የሶማሌና የኦሮሚያ ክልል አመራሮች በኦሮሚያ ክልል እና የሶማሌ ክልል ትምህርት ቤቶች የሱማሊኛና የአፋን ኦሮሞ ቋንቋን ለመስጠት መስማማታቸው ይታወሳል። በያተያዘው እቅድ መሰረትም ትናንት የሶማሌ ክልል ትምህርት ቢሮ ኃላፊ አቶ መሀመድ ፋታህ፣ የኦሮሚያ ክልል ትምህርት ቢሮ ምክትል ኃላፊ አቶ ግርማ ባይሳ እና ሌሎች የኦሮሚያና የሶማሌ ክልል አመራሮች በኦሮሚያ ክልል የምሥራቅ ሀረርጌ ዞን ጭናክሰን ወረዳ የዋሊድ አንደኛ ደረጃ ትምህርት ቤት ተገኝተው የሱማሊኛ ቋንቋ ትምህርትን አስጀምረዋል።በዚህ ወቅትም የሥራ ኃላፊዎቹ የቋንቋው መሰጠት መጀመር የህዝቡን ትስስር የሚያጠናክር ነው ብለዋል።በኦሮሚያ ክልል በ11 ትምህርት ቤቶች የሱማሊኛ ቋንቋ እንደተጨማሪ ቋንቋ ትምህርት በመሰጠት |
የኤርትራው ፕሬዚዳንት ኢሳያስ አፈወርቂ በሀገሪቱ ላይ ሊደረጉ ለሚገቡ ዋና ዋና ማሻሻያዎች ችኮላ እንደማይገባ የኤርትራን 28ኛ አመት የነፃነት ክብረ በዓል አስመልክቶ በዛሬው ዕለት ባደረጉት ንግግር ገልፀዋል። |
የኤርትራው ፕሬዚዳንት ኢሳያስ አፈወርቂ ለማሻሻያዎች ችኮላ እንደማይገባ ገለፁ\nሁለቱ ሃገራት ጦርነትና ሰላም በሌለበት ሁኔታ ከሁለት አስርት አመታት ፍጥጫ በኋላ በሰላም በመቋጨቱ ማግስት ፕሬዚዳንት ኢሳያስ ፖለቲካዊ ማሻሻያዎችን ሊያውጁ ይችላሉ በሚልም በተለያዩ አገራት በሚኖሩ ኤርትራውያን ዘንድ እየተጠበቁ ነበር። |
ኤርትራዊያን ሊያዩ የሚሿቸው አምስት ለውጦች\nየኤርትራው ፕሬዝደንት ኢሳያስ አፈወርቂ በሃገራቸው ለሚታየው የሰብዓዊ መብት ጥሰት ከኢትዮጵያ ጋር ያላቸው አለመስማማት ዋነኛ ምክንያት እንደሆነ ሲያቀርቡ ቆይተዋል። |
የኤርትራ ፕሬዚዳንት ኢሣያስ አፈወርቂ ኢትዮጵያ በመግባታቸውና በሁለቱ ሃገሮች መካከል ሰላም በመበሰሩ የተሰማቸው ደስታ እስከማልቀስ እንዳደረሳቸው በዘመነ ደርግ የኤርትራ አስተዳዳሪ የነበሩት ሻለቃ ዳዊት ወልደጊዮርጊስ ለቪኦኤ ገለፁ።ሻለቃ ዳዊት ካለፈ ታሪክ እያጣቀሱ ለቪኦኤ በሰጡት ማብራሪያ የሁለቱ ሃገሮች ግንኙነት አሁን ወደደረሰበት ሁኔታ መለወጡ በስትራተጂ፣ አካባቢያዊ ደኅንነት፣ በምጣኔኃብት መተጋገዝና የሁለቱን ሃገሮች ሕዝቦች አንድነት በማጠናከር ላይ ለመሥራት አማራጭ የሌለው መንገድ እንደሆነ ጠቁመዋል።በ1981 ዓ.ም. በኮሎኔል መንግሥቱ ኃይለማርያም ላይ መፈንቅለ-መንግሥት ተሞክሮ በነበረ ጊዜም የኩዴታው ጠንሳሾች ከሕዝባዊ ግንባር ሐርነት ኤርትራ መሪዎች ጋር ለመሥራት ጥረው እንደነበርና የደርግ ሥርዓት ሲወድቅም ኢሣያስ አፈወርቂ ኢትዮጵያና ኤርትራን አንድ አድርገው እንዲመሩ ሃሣብ ቀርቦላቸው እንደነበረ ሻለቃ ዳዊት ገልፀዋል።የኢትዮጵያና የኤርትራ ሕዝቦች “የተለያዩ ሁለት ሕዝቦች ናቸው የሚሉ የተሣሣቱ ናቸው፤ እኔ በየትኛውም ፅሁፌና ንግግሬ እንዲህ ብዬ አላውቅም” ብለዋል።ለሙሉው ቃለ-ምልልስ የተያያዘውን የድምፅ ፋይል ያዳምጡ። |
የአበርገሌን ወርቅ እንደጠጠር ከመታየት የሚታደገው አሠራር ከወዴት ይሆን? |
ባሕር ዳር፡ ሚያዝያ 29/2012 ዓ.ም (አብመድ) በዋግ ኽምራ ብሔረሰብ አስተዳደር አበርገሌ ወረዳ የሚገኙ ቀበሌዎች የወርቅ ሀብት መገኛ ናቸው፡፡ በተለይ በኽምጠኛ ቋንቋ ‘ዊርቀ ዲቭኑ’ የሚል የቆየ የአካባቢው ነዋሪዎች ስያሜ የተሰጣት ቀበሌ ወርቅ ምድር ትባላለች፡፡ ዊርቀ ዲቭኑ ወርቅ የተቀበረባት ቦታ የሚል አቻ የአማርኛ ፍች አለው፡፡ የአካባቢው አስተዳደር በይፋ ‘‘ከ1990ዎቹ ወዲህ ወርቅ መኖሩ ተረጋግጧል’’ ይበል እንጂ የቀበሌው ስያሜ ከዚያ በፊትም እንደነበር የሚያመላክቱ ማስረጃዎች አሉ፡፡በወል መሬቶች እና በግለሰቦች የእርሻ ማሳ መጠኑ ያልታወቀ የወርቅ ማዕድን ግለሰቦች ሲያወጡ አብመድ በአካል ተመልክቷል፡፡ ነገሩ ግን ወርቅን እንደጠጠር ካለበት አለማንሳት፣ ዘመናዊ አብመድ ካነጋገራቸው የወርቅ ማዕድን አውጭ ወጣቶች መካከል አቶአ ለለ ተክለሃይማኖ ‘‘ወርቅ የማውጣቱ ሥራ እጅግ ባህላዊ ነው’’ ብሏል፡፡ ቀኑን ሙሉ በአካፋና ዶማ እየቀጠቀጡ ግምታዊ የወርቅ ፍለጋ ሥራን ስለሚያከናውኑ አድካሚ ቢሆንም በቀላሉ ወርቁ ሲገኝ ደግሞ ማካካስ እንደሚያስችላቸው ተናግሯል፡፡ በሰው ጉልበት ብቻ የሚደረገው የወርቅ ማውጣት ሥራ በቂ ያለመሆን፣ የተደራጀ የማውጣት አካሄድ አለመኖርና ዘመናዊ መሣሪያዎችን በመጠቀም ማውጣት ባለመቻሉ ሀብቱን በአግባቡ መጠቀም አለመቻላቸውን ነው የተናገረው፡፡ መንግሥትም ሆነ ባለሀብቶች ወደ ወረዳው ገብተው ለመሥራት ፍላጎት ከሌላቸው በርካታ የወረዳው ወጣቶች ተደራጅተው እንዲሠሩ ዘመናዊ የወርቅ ማመላከቻና ማውጫ መሣሪያዎች በብድር እንዲሰጣቸው ጠይቀዋል፡፡አቶ አበራ ወልደሰንበት በእርሻ ማሳቸው ክምችቱ በውል ያልተወቀ የወርቅ ማዕድን እንዳለ ይናገራሉ፡፡ ከ2003 ዓ.ም ጀምሮ የእርሻ ማሳቸው ቀንና ማታ በድብቅ እየተቆፈረ ለሕገ ወጥ ወርቅ አውጭዎች ሲሳ... |
በዚህ ወቅት ነው ሠላማዊት ስለበርኖስ ብዙ ነገሮችን የተማረችው። በርኖስ የሚሠራው ከበግ ጸጉር ቢሆንም ሁሉም የበግ ጸጉር ግን ለበርኖስ ሥራ አያገለግልም ትላለች። |
የለንደን |
MatryoshkaLoss with these parameters:{
"loss": "MultipleNegativesRankingLoss",
"matryoshka_dims": [
512,
256
],
"matryoshka_weights": [
1,
1
],
"n_dims_per_step": -1
}
eval_strategy: epochper_device_train_batch_size: 128per_device_eval_batch_size: 128gradient_accumulation_steps: 2learning_rate: 6e-05num_train_epochs: 6lr_scheduler_type: cosinewarmup_ratio: 0.025fp16: Trueload_best_model_at_end: Trueoptim: adamw_torch_fusedbatch_sampler: no_duplicatesoverwrite_output_dir: Falsedo_predict: Falseeval_strategy: epochprediction_loss_only: Trueper_device_train_batch_size: 128per_device_eval_batch_size: 128per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 2eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 6e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1.0num_train_epochs: 6max_steps: -1lr_scheduler_type: cosinelr_scheduler_kwargs: {}warmup_ratio: 0.025warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falseuse_ipex: Falsebf16: Falsefp16: Truefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Trueignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torch_fusedoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseinclude_for_metrics: []eval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters: auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: Falseneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseeval_use_gather_object: Falseaverage_tokens_across_devices: Falseprompts: Nonebatch_sampler: no_duplicatesmulti_dataset_batch_sampler: proportional| Epoch | Step | Training Loss | dim_512_cosine_ndcg@10 | dim_256_cosine_ndcg@10 |
|---|---|---|---|---|
| -1 | -1 | - | 0.0616 | 0.0458 |
| 1.0 | 481 | 2.2412 | 0.7514 | 0.7445 |
| 2.0 | 962 | 0.5094 | 0.7670 | 0.7595 |
| 3.0 | 1443 | 0.2201 | 0.7733 | 0.7684 |
| 4.0 | 1924 | 0.1298 | 0.7762 | 0.7720 |
| 5.0 | 2405 | 0.0954 | 0.7789 | 0.7727 |
| 6.0 | 2886 | 0.0843 | 0.7794 | 0.7736 |
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
@misc{kusupati2024matryoshka,
title={Matryoshka Representation Learning},
author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
year={2024},
eprint={2205.13147},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
Base model
rasyosef/roberta-medium-amharic