Matryoshka Representation Learning
Paper • 2205.13147 • Published • 26
How to use HoangVuSnape/halong_embedding_pr_v2_ep30 with sentence-transformers:
from sentence_transformers import SentenceTransformer
model = SentenceTransformer("HoangVuSnape/halong_embedding_pr_v2_ep30")
sentences = [
"Những điểm đặc biệt của chương trình học là gì?",
"Các phòng thí nghiệm này giúp sinh viên thực hành và nghiên cứu các phản ứng hoá học, phân tích chất lượng sản phẩm và môi trường. CÁC ĐIỂM ĐẶC BIỆT\n\nChương trình học thực tiễn: Sinh viên có cơ hội tham gia các nghiên cứu thực tế tại các phòng thí nghiệm của trường và các công ty, giúp họ phát triển các kỹ năng thực hành và nghiên cứu hoá học. Môi trường học tập quốc tế: Sinh viên có cơ hội tham gia các chương trình trao đổi sinh viên và hợp tác nghiên cứu với các đối tác quốc tế trong lĩnh vực hoá học. Học bổng và cơ hội du học: Các chương trình học bổng và cơ hội du học bậc thạc sĩ, tiến sĩ tại các trường đại học danh tiếng trên thế giới. TRIỂN VỌNG NGHỀ NGHIỆP & CƠ HỘI VIỆC LÀM\n\nSinh viên tốt nghiệp ngành Hoá học có thể làm việc trong các lĩnh vực như:\n\nCông nghiệp hoá chất và dược phẩm: Làm việc tại các công ty sản xuất hoá chất, dược phẩm, sản xuất vật liệu và sản phẩm hoá học khác. Ngành thực phẩm và bảo vệ môi trường: Nghiên cứu và phát triển các sản phẩm thực phẩm, phân tích chất lượng thực phẩm, và xử lý chất thải hoá học trong công nghiệp.",
"Trường Đại học Ngoại Thương Cơ sở II\n\nTiếng Anh: Foreign Trade University Ho Chi Minh City Campus (FTU2) Trường Đại học Ngoại Thương cơ sở II là cơ sở đào tạo phía Nam của Trường Đại học Ngoại thương tại Hà Nội, đại học chuyên ngành kinh tế đầu ngành tại Việt Nam và thành viên của Bộ Giáo dục và Đào tạo. Cơ sở này được thành lập dựa trên nhu cầu đào tạo cán bộ trong lĩnh vực kinh tế và kinh doanh quốc tế tại các tỉnh thành phía Nam trong giai đoạn hội nhập kinh tế quốc tế. Cơ sở được thành lập theo Quyết định số 1485/GD-ĐT ngày 16/07/1993 của Bộ trưởng Bộ Giáo dục và Đào tạo Việt Nam. Tên trường: Trường Đại học Ngoại thương (Cơ sở 2)\n\nTên tiếng Anh: Foreign Trade University (FTU)\n\nMã trường: NTS\n\nTrực thuộc: Bộ Giáo dục và Đào tạo\n\nLoại trường: Công lập\n\nLoại hình đào tạo: Đại học – Sau đại học\n\nLĩnh vực: Kinh tế\n\nĐịa chỉ: Số 15 Đường D5, Khu Văn Thánh Bắc, Phường 25, Quận Bình Thạnh, TP Hồ Chí Minh\n\nĐiện thoại:\n\nEmail:\n\nWebsite: http://cs2.ftu.edu.vn/\n\nFanpage: https://www.facebook.com/ftu2hcmc/\n\nLịch sử\n\n1962\n\nNgày 20/06/1962, theo Quyết định của Thủ tướng Chính phủ, Khoa Quan hệ Quốc tế tách khỏi Trường Đại học Kinh tế - Tài chính để thành lập Trường Cán bộ Ngoại giao - Ngoại thương trực thuộc Bộ Ngoại giao. Trụ sở ban đầu được đặt tại làng Láng, tỉnh Hà Đông (nay là phường Láng Thượng, Hà Nội). 1967\n\nNgày 05/08/1967, theo đề nghị của Bộ Ngoại giao và Bộ Ngoại thương, Thủ tướng Phạm Văn Đồng đã ký Quyết định số 123/CP, chia tách Trường Cán bộ Ngoại giao - Ngoại thương thành hai trường:\n\nTrường Ngoại giao (nay là Học viện Ngoại giao) trực thuộc Bộ Ngoại giao. Trường Ngoại thương thuộc Bộ Ngoại thương (nay là Bộ Công Thương). 1985\n\nTrường Đại học Ngoại thương chuyển từ Bộ Ngoại thương sang trực thuộc Bộ Đại học và Trung học Chuyên nghiệp (nay là Bộ Giáo dục và Đào tạo). 1993\n\nNgày 16/07/1993, xuất phát từ nhu cầu đào tạo cán bộ kinh tế và kinh doanh quốc tế tại Thành phố Hồ Chí Minh và các tỉnh thành phía Nam, Cơ sở II Trường Đại học Ngoại thương tại TP.",
"Điểm xét tuyển được làm tròn đến 02 chữ số thập phân. - Điểm xét tuyển được xác định như sau (làm tròn đến 02 chữ số thập phân): Điểm xét tuyển = [(ĐM1*HS môn 1+ ĐM2*HS môn 2 + ĐM3 * HS môn 3)*3]/(Tổng hệ số) + Điểm ưu tiên Khu vực + Điểm ưu tiên đối tượng. (*) Điểm trúng tuyển ngành Luật, Luật kinh tế: tổ hợp Văn, Sử, Địa cao hơn 1.5 điểm. (1) Ngành ngôn ngữ Anh, ngôn ngữ Trung Quốc, ngôn ngữ Nhật, ngôn ngữ Hàn Quốc: Ngoại ngữ nhân hệ số 2. (2) Các ngành Khoa học máy tính, Khoa học máy tính Chất lượng cao, Công nghệ thông tin, CTKT công trình xây dựng, CNKT công trình xây dựng Chất lượng cao, Quản lý xây dựng: Toán nhân hệ số 2. (3) Các ngành Chất lượng cao: Luật kinh tế, Ngôn ngữ Anh, Ngôn ngữ Trung Quốc, Quản trị kinh doanh, Tài chính ngân hàng, Kế toán: Ngoại ngữ hệ số 2. VII.Điểm chuẩn Trường ĐH Mở TP.HCM năm 2021 dựa vào kết quả học tập THPT(học bạ)\n\ni."
]
embeddings = model.encode(sentences)
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [4, 4]This is a sentence-transformers model finetuned from hiieu/halong_embedding. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False, 'architecture': 'XLMRobertaModel'})
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("HoangVuSnape/halong_embedding_pr_v2_ep30")
# Run inference
sentences = [
'Xin hãy liệt kê các trung tâm của Trường Đại học Sư phạm Kỹ thuật TP. Hồ Chí Minh.',
'Phòng Đào tạo\n\n2. Phòng Đào tạo không chính quy\n\n3. Phòng Tuyển sinh và Công tác Sinh viên\n\n4. Phòng Truyền thông\n\n5. Phòng Khoa học Công nghệ - Quan hệ Quốc tế\n\n6. Phòng Quan hệ Doanh nghiệp\n\n7. Phòng Thanh tra - Giáo dục\n\n8. Phòng Đảm bảo Chất lượng\n\n9. Phòng Tổ chức - Hành chính\n\n10. Phòng Kế hoạch - Tài chính\n\n11. Phòng Quản trị Cơ sở Vật chất\n\n12. Phòng Thiết bị - Vật tư\n\n13. Ban quản lý KTX\n\n14. Trạm Y tế\n\n15. Bộ phận Quản lý Hồ sơ Dự án\n\nC. Danh sách các trung tâm của Trường Đại học Sư phạm Kỹ thuật Thành phố Hồ Chí Minh:\n\n1. Ngoại ngữ\n\n2. Tin học\n\n3. Thư viện\n\n4. Hợp tác Đào tạo Quốc tế\n\n5. Việt – Đức\n\n6. Dịch vụ Sinh viên\n\n7. Thông tin – Máy tính\n\n8. Dạy học số\n\n9. Kỹ thuật Tổng hợp\n\n10. Chế tạo và Thiết kế Thiết bị Công nghiệp\n\n11. Đào tạo và hướng nghiệp quốc tế Việt Nhật\n\n12. Đào tạo ngắn hạn\n\n13. Giáo dục Thể chất - Quốc phòng\n\n14. Đào tạo Bồi dưỡng giáo viên phổ thông, giáo dục nghề nghiệp miền Trung - Tây Nguyên\n\n15. Nghiên cứu và Ứng dụng Kỹ thuật Xây dựng\n\n16. Bồi dưỡng và Đánh giá kỹ năng nghề Quốc gia\n\n17. Phát triển ngôn ngữ\n\n18. Nghiên cứu và Chuyển giao Công nghệ\n\n19. Công nghệ phần mềm\n\n20. Hàn ngữ học Dong A\n\n21. Sáng tạo và Khởi nghiệp\n\n22. Trung tâm hướng nghiệp và đào tạo Việt Nhật\n\nD. Các ngành đào tạo trình độ đại học\n\nĐi cùng với sự vận động và phát triển của nền kinh tế đất nước theo hướng công nghiệp hóa, hiện đại hóa, Trường Đại học Sư phạm Kỹ thuật Tp. Hồ Chí Minh đã tiếp cận thực tế để mở rộng đào tạo gần 30 ngành đào tạo trình độ đại học\n\ni.',
'Thực hiện hướng dẫn của Bộ Giáo dục và Đào tạo tại Công văn số 1919/BGDĐT-GDĐH ngày 28 tháng 4 năm 2023, phương thức xét tuyển kết quả điểm thi tốt nghiệp Trung học phổ thông vẫn được giữ nguyên như năm 2022. Tổ hợp môn xét tuyển: B00 (Toán – Hóa – Sinh) chung cho tất cả các ngành. năm 2022, Trường Đại học Y khoa Phạm Ngọc Thạch tuyển được 1.367 chỉ tiêu (đạt 104,4% so với chỉ tiêu đề ra). chỉ tiêu tuyển sinh đại học chính quy của Trường Đại học Y khoa Phạm Ngọc Thạch năm 2023. 1. Y khoa: 660 2. Dược học: 90 3. Điều dưỡng: 250 4. Dinh dưỡng: 60 5. Răng Hàm Mặt: 90 6. Kỹ thuật xét nghiệm y học: 50 7. Kỹ thuật hình ảnh y học: 40 8. Kỹ thuật phục hồi chức năng: 30 9. Khúc xạ nhãn khoa: 40 10. Y tế công cộng: 56\n\nGhi chú: chỉ tiêu được chia cho các thí sinh có hộ khẩu ở TP HCM và ngoài TP HCM với tỉ lệ 50%\n\nĐiểm chuẩn của trường Đại học Y khoa Phạm Ngọc Thạch 2023: Y khoa, Điểm chuẩn thí sinh có hộ khẩu tại TP HCM(TP): 25,90, Điểm chuẩn thí sinh có hộ khẩu ngoài TP HCM(TQ): 26.31 Dược học, Điểm chuẩn thí sinh có hộ khẩu tại TP HCM(TP): 25,28, Điểm chuẩn thí sinh có hộ khẩu ngoài TP HCM(TQ): 25,25 Điều dưỡng, Điểm chuẩn thí sinh có hộ khẩu tại TP HCM(TP): 22,40, Điểm chuẩn thí sinh có hộ khẩu ngoài TP HCM(TQ): 22,40 Dinh dưỡng, Điểm chuẩn thí sinh có hộ khẩu tại TP HCM(TP): 22,25, Điểm chuẩn thí sinh có hộ khẩu ngoài TP HCM(TQ): 22,80 Răng - Hàm - Mặt, Điểm chuẩn thí sinh có hộ khẩu tại TP HCM(TP): 26,00, Điểm chuẩn thí sinh có hộ khẩu ngoài TP HCM(TQ): 26,28 Kỹ thuật Xét nghiệm Y học, Điểm chuẩn thí sinh có hộ khẩu tại TP HCM(TP): 24,54, Điểm chuẩn thí sinh có hộ khẩu ngoài TP HCM(TQ): 24,47 Kỹ thuật Hình ảnh Y học, Điểm chuẩn thí sinh có hộ khẩu tại TP HCM(TP): 23,45, Điểm chuẩn thí sinh có hộ khẩu ngoài TP HCM(TQ): 23,61 Khúc xạ nhãn khoa, Điểm chuẩn thí sinh có hộ khẩu tại TP HCM(TP): 23,75, Điểm chuẩn thí sinh có hộ khẩu ngoài TP HCM(TQ): 23,75 Y tế công cộng, Điểm chuẩn thí sinh có hộ khẩu tại TP HCM(TP): 18,85, Điểm chuẩn thí sinh có hộ khẩu ngoài TP HCM(TQ): 18,35 Kỹ thuật Phục hồi chức năng, Điểm chuẩn thí sinh có hộ khẩu tại TP HCM(TP): 23,15, Điểm chuẩn thí sinh có hộ khẩu ngoài TP HCM(TQ): 23,09',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities)
# tensor([[ 1.0000, 0.6708, -0.0627],
# [ 0.6708, 1.0000, -0.0218],
# [-0.0627, -0.0218, 1.0000]])
dim_768InformationRetrievalEvaluator with these parameters:{
"truncate_dim": 768
}
| Metric | Value |
|---|---|
| cosine_accuracy@1 | 0.7011 |
| cosine_accuracy@3 | 0.9307 |
| cosine_accuracy@5 | 0.9735 |
| cosine_accuracy@10 | 0.9986 |
| cosine_precision@1 | 0.7011 |
| cosine_precision@3 | 0.3102 |
| cosine_precision@5 | 0.1947 |
| cosine_precision@10 | 0.0999 |
| cosine_recall@1 | 0.7011 |
| cosine_recall@3 | 0.9307 |
| cosine_recall@5 | 0.9735 |
| cosine_recall@10 | 0.9986 |
| cosine_ndcg@10 | 0.8631 |
| cosine_mrr@10 | 0.818 |
| cosine_map@100 | 0.8181 |
dim_512InformationRetrievalEvaluator with these parameters:{
"truncate_dim": 512
}
| Metric | Value |
|---|---|
| cosine_accuracy@1 | 0.7133 |
| cosine_accuracy@3 | 0.947 |
| cosine_accuracy@5 | 0.9783 |
| cosine_accuracy@10 | 0.9973 |
| cosine_precision@1 | 0.7133 |
| cosine_precision@3 | 0.3157 |
| cosine_precision@5 | 0.1957 |
| cosine_precision@10 | 0.0997 |
| cosine_recall@1 | 0.7133 |
| cosine_recall@3 | 0.947 |
| cosine_recall@5 | 0.9783 |
| cosine_recall@10 | 0.9973 |
| cosine_ndcg@10 | 0.8714 |
| cosine_mrr@10 | 0.8292 |
| cosine_map@100 | 0.8294 |
dim_256InformationRetrievalEvaluator with these parameters:{
"truncate_dim": 256
}
| Metric | Value |
|---|---|
| cosine_accuracy@1 | 0.7283 |
| cosine_accuracy@3 | 0.9436 |
| cosine_accuracy@5 | 0.9851 |
| cosine_accuracy@10 | 0.9986 |
| cosine_precision@1 | 0.7283 |
| cosine_precision@3 | 0.3145 |
| cosine_precision@5 | 0.197 |
| cosine_precision@10 | 0.0999 |
| cosine_recall@1 | 0.7283 |
| cosine_recall@3 | 0.9436 |
| cosine_recall@5 | 0.9851 |
| cosine_recall@10 | 0.9986 |
| cosine_ndcg@10 | 0.8785 |
| cosine_mrr@10 | 0.8382 |
| cosine_map@100 | 0.8383 |
anchor and positive| anchor | positive | |
|---|---|---|
| type | string | string |
| details |
|
|
| anchor | positive |
|---|---|
Ngành Quản lý Tài nguyên và Môi trường trang bị cho sinh viên những kiến thức và kỹ năng gì? |
Sau khi tốt nghiệp, người học sẽ: |
Chương trình Kỹ thuật Môi trường đào tạo sinh viên về những năng lực nào và có điểm gì nổi bật đối với chương trình giảng dạy bằng tiếng Anh? |
Sau khi tốt nghiệp, người học sẽ: |
Ngành Kỹ thuật Dầu khí và Kỹ thuật Địa chất tập trung nghiên cứu và ứng dụng những lĩnh vực cốt lõi nào? |
Các công ty nghiên cứu và khảo sát địa chất, tư vấn về nền móng công trình. Các tổ chức liên quan đến quy hoạch và phát triển đô thị. Kỹ thuật Dầu khí |
MatryoshkaLoss with these parameters:{
"loss": "MultipleNegativesRankingLoss",
"matryoshka_dims": [
768,
512,
256,
12
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": -1
}
eval_strategy: stepsper_device_train_batch_size: 16per_device_eval_batch_size: 16gradient_accumulation_steps: 8learning_rate: 2e-05num_train_epochs: 20lr_scheduler_type: cosinewarmup_ratio: 0.1bf16: Truetf32: Truedataloader_drop_last: Truedataloader_num_workers: 8load_best_model_at_end: Truebatch_sampler: no_duplicatesoverwrite_output_dir: Falsedo_predict: Falseeval_strategy: stepsprediction_loss_only: Trueper_device_train_batch_size: 16per_device_eval_batch_size: 16per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 8eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 2e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1.0num_train_epochs: 20max_steps: -1lr_scheduler_type: cosinelr_scheduler_kwargs: {}warmup_ratio: 0.1warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falseuse_ipex: Falsebf16: Truefp16: Falsefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Truelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Truedataloader_num_workers: 8dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Trueignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torch_fusedoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsehub_revision: Nonegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseinclude_for_metrics: []eval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters: auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: Falseneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseliger_kernel_config: Noneeval_use_gather_object: Falseaverage_tokens_across_devices: Falseprompts: Nonebatch_sampler: no_duplicatesmulti_dataset_batch_sampler: proportionalrouter_mapping: {}learning_rate_mapping: {}| Epoch | Step | Training Loss | dim_768_cosine_ndcg@10 | dim_512_cosine_ndcg@10 | dim_256_cosine_ndcg@10 |
|---|---|---|---|---|---|
| -1 | -1 | - | 0.4874 | 0.4819 | 0.4590 |
| 0.8696 | 10 | 4.9811 | 0.5533 | 0.5504 | 0.5373 |
| 1.6957 | 20 | 3.199 | 0.5998 | 0.5976 | 0.5848 |
| 2.5217 | 30 | 2.4565 | 0.6495 | 0.6470 | 0.6373 |
| 3.3478 | 40 | 1.9622 | 0.6775 | 0.6733 | 0.6717 |
| 4.1739 | 50 | 1.5012 | 0.7019 | 0.7008 | 0.6911 |
| 5.0 | 60 | 1.1534 | 0.7123 | 0.7118 | 0.7067 |
| 5.8696 | 70 | 1.1291 | 0.7201 | 0.7274 | 0.7238 |
| 6.6957 | 80 | 0.9064 | 0.7274 | 0.7338 | 0.7316 |
| 7.5217 | 90 | 0.9967 | 0.7309 | 0.7385 | 0.7373 |
| 8.3478 | 100 | 0.8916 | 0.7320 | 0.7429 | 0.7421 |
| 9.1739 | 110 | 0.8854 | 0.7330 | 0.7448 | 0.7425 |
| 10.0 | 120 | 0.8051 | 0.7325 | 0.7449 | 0.7417 |
| 0.8696 | 10 | 0.6824 | 0.7381 | 0.7455 | 0.7486 |
| 1.6957 | 20 | 0.5332 | 0.7441 | 0.7526 | 0.7540 |
| 2.5217 | 30 | 0.4923 | 0.7538 | 0.7624 | 0.7626 |
| 3.3478 | 40 | 0.4799 | 0.7648 | 0.7699 | 0.7720 |
| 4.1739 | 50 | 0.3966 | 0.7800 | 0.7844 | 0.7923 |
| 5.0 | 60 | 0.3537 | 0.7821 | 0.7855 | 0.7937 |
| 5.8696 | 70 | 0.4381 | 0.8018 | 0.8041 | 0.8087 |
| 6.6957 | 80 | 0.3841 | 0.8031 | 0.8075 | 0.8166 |
| 7.5217 | 90 | 0.4583 | 0.7995 | 0.8096 | 0.8167 |
| 8.3478 | 100 | 0.4325 | 0.8214 | 0.8290 | 0.8314 |
| 9.1739 | 110 | 0.4238 | 0.8328 | 0.8363 | 0.8389 |
| 10.0 | 120 | 0.3629 | 0.8389 | 0.8446 | 0.8487 |
| 10.8696 | 130 | 0.3197 | 0.8428 | 0.8492 | 0.8553 |
| 11.6957 | 140 | 0.3398 | 0.8484 | 0.8568 | 0.8613 |
| 12.5217 | 150 | 0.3145 | 0.8523 | 0.8609 | 0.8635 |
| 13.3478 | 160 | 0.3005 | 0.8540 | 0.8611 | 0.8680 |
| 14.2609 | 170 | 0.3277 | 0.8571 | 0.8636 | 0.8743 |
| 15.1739 | 180 | 0.3455 | 0.8600 | 0.8678 | 0.8765 |
| 16.0 | 190 | 0.3061 | 0.8591 | 0.8668 | 0.8753 |
| 16.8696 | 200 | 0.2603 | 0.8603 | 0.8687 | 0.8763 |
| 17.6957 | 210 | 0.28 | 0.8605 | 0.8697 | 0.8776 |
| 18.5217 | 220 | 0.3435 | 0.8628 | 0.8705 | 0.8785 |
| 19.3478 | 230 | 0.2589 | 0.8631 | 0.8714 | 0.8785 |
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
@misc{kusupati2024matryoshka,
title={Matryoshka Representation Learning},
author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
year={2024},
eprint={2205.13147},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
Base model
intfloat/multilingual-e5-base