benchmark-dataset

Here are 18 public repositories matching this topic...

keshik6 / HourVideo

[NeurIPS 2024] Official code for HourVideo: 1-Hour Video Language Understanding

navigation perception summarization reasoning visual-reasoning egocentric-videos gpt-4 multiple-choice-questions benchmark-dataset video-language-understanding multimodal-large-language-models evals gemini-pro spatial-intelligence neurips-2024 1-hour-video-language-understanding long-form-video-language-understanding long-context-understanding

Updated Jul 12, 2025
Jupyter Notebook

Event-AHU / EventVOT_Benchmark

Star

[CVPR-2024] The First High Definition (HD) Event based Visual Object Tracking Benchmark Dataset

visual-tracking multi-modal single-object-tracking visual-object-tracking cross-modality high-definition benchmark-dataset rgb-event event-based-tracking

Updated Feb 28, 2026
Python

LidiaGarrucho / MAMA-MIA

Star

The MAMA-MIA Dataset: A Multi-Center Breast Cancer DCE-MRI Public Dataset with Expert Segmentations

deep-learning medical-imaging cancer-imaging-research pretrained-models mri-images dce-mri radiomics breast-cancer pretrained-weights 3d-segmentation tumor-segmentation tumor-classification mri-segmentation public-dataset breast-cancer-dataset foundation-models benchmark-dataset nnunet-v2

Updated Mar 3, 2026
Jupyter Notebook

Event-AHU / COESOT

Star

[Pattern Recognition 2025] A large-scale benchmark dataset for color-event based visual tracking

transformer multi-modal single-object-tracking visual-object-tracking event-camera dynamic-vision-sensors benchmark-dataset rgb-event coesot multi-modality-tracking

Updated Nov 5, 2025
Python

Event-AHU / CeleX-HAR

Star

[IJCV-2026, arXiv:2408.09764] Event Stream based Human Action Recognition: A High-Definition Benchmark Dataset and Algorithms

event-camera benchmark-dataset event-based-recognition celex-camera mamba-network

Updated Jan 20, 2026
Python

floriankagerer / bed-bpp-env

Star

This repository contains a gym environment that can be used for developing solvers for robotic 3D bin packing problems.

python bin-packing 3d-bin-packing benchmark-dataset palletizing

Updated Dec 5, 2025
Python

VinAIResearch / PhoST

Star

A High-Quality and Large-Scale Dataset for English-Vietnamese Speech Translation (INTERSPEECH 2022)

vietnamese machine-translation english speech-translation phost benchmark-dataset english-to-vietnamese

Updated Jun 5, 2025

PNNL-CompBio / coderdata

Star

Dataset package for facile training and testing of machine learning/AI algorithms that predict drug response in cancer model systems.

machine-learning deep-learning cancer drug-response benchmark-dataset

Updated Feb 11, 2026
Jupyter Notebook

AdvSV stands as the first dataset developed specifically for evaluating Speaker Verification (SV) systems against adversarial attacks. It aims to benchmark the robustness of ASV models in the face of such attacks and offers vital resources for researchers to explore the characteristics of adversarial and replay attacks in this domain.

speaker-verification replay-attack adversarial-attacks benchmark-dataset over-the-air-attack

Updated Nov 21, 2023
HTML

samresume / Cleaned-SWANSF-Dataset

Star

The SWAN-SF dataset is now fully preprocessed, optimized, and ready for binary classification tasks. Our team is excited to release the enhanced version of the SWAN-SF dataset across all five partitions.

dataset preprocessing time-series-analysis time-series-classification multivariate-timeseries timegan benchmark-dataset solar-flare-prediction swansf

Updated Oct 29, 2024

brucelyu17 / SC-TC-Bench

Star

[FAccT '25] Characterizing Bias: Benchmarking LLMs in Simplified versus Traditional Chinese

traditional-chinese simplified-chinese algorithmic-fairness large-language-models benchmark-dataset language-generation-biases algorithmic-audits chinese-character-sets facct-2025 ic2s2-2025

Updated Nov 2, 2025
Python

scDiffEq / LARRY-dataset

Star

Documentation associated with preparing and formatting datasets LARRY datasets for ML applications with pytorch / pytorch lightning

python pytorch scrna-seq single-cell pytorch-lightning lineage-tracing benchmark-dataset

Updated May 29, 2025
Jupyter Notebook

lemma-rca / lemma-rca.github.io

Star

Code for LEMMA-RCA website

root-cause-analysis multi-modal-learning causal-discovery benchmark-dataset

Updated May 26, 2025
HTML

lias-laboratory / yellowhammer-benchmark

Star

Collaborating to improve population dynamics models through benchmark dataset validation

biostatistics system-identification population-dynamics ecological-modelling parametric-estimation benchmark-dataset data-driven-modelling biodiversity-loss global-change-impacts

Updated Jan 9, 2026

thanigachalam / dental-notes-benchmark

Star

Open synthetic benchmark dataset for dental clinical note extraction and summarization with ICD-10-CM diagnoses and structured tooth-level annotations.