vision-and-language-navigation

Here are 20 public repositories matching this topic...

intelligolabs / R2RIE-CE

Official repository of "Mind the Error! Detection and Localization of Instruction Errors in Vision-and-Language Navigation". We present the first dataset - R2R-IE-CE - to benchmark instructions errors in VLN. We then propose a method, IEDL.

vision-and-language-navigation vln embodied-ai

Updated Aug 3, 2024
Python

Feliciaxyao / ICML2024-FSTTA

Star

Fast-Slow Test-time Adaptation for Online Vision-and-Language Navigation

vision-and-language-navigation test-time-adaptation

Updated Jul 30, 2024
Python

CrystalSixone / VLN-GOAT

Star

Repository for Vision-and-Language Navigation via Causal Learning (Accepted by CVPR 2024)

vision-and-language-navigation

Updated Jul 23, 2024
Python

GT-RIPL / robo-vln

Star

Pytorch code for ICRA'21 paper: "Hierarchical Cross-Modal Agent for Robotics Vision-and-Language Navigation"

python language deep-neural-networks computer-vision deep-learning robotics navigation transformers pytorch artificial-intelligence supervised-learning bert vision-and-language vision-and-language-navigation habitat-api habitat-sim

Updated Jun 27, 2024
Python

eric-ai-lab / awesome-vision-language-navigation

Star

A curated list for vision-and-language navigation. ACL 2022 paper "Vision-and-Language Navigation: A Survey of Tasks, Methods, and Future Directions"

navigation vision-and-language embodied-agent vision-and-language-navigation

Updated May 2, 2024

daqingliu / awesome-vln

Star

A curated list of research papers in Vision-Language Navigation (VLN)

computer-vision awesome-list arxiv papers natural-language-understanding vision-and-language vision-and-language-navigation

Updated Apr 17, 2024

eric-ai-lab / Naivgation-as-wish

Star

Official implementation of the NAACL 2024 paper "Navigation as Attackers Wish? Towards Building Robust Embodied Agents under Federated Learning"

robustness attack-defense federated-learning embodied-agent vision-and-language-navigation

Updated Apr 10, 2024
Python

Gtothemoon / Contrastive-VisionVAE-Follower

Star

Contrastive-VisionVAE-Follower is a model used for multi-modal task called Vision-and-Language Navigation (VLN).

nlp deep-learning cv pytorch lstm variational-autoencoder matterport3d-simulator multi-modal-learning vision-and-language-navigation vln contrastive-learning

Updated Jan 24, 2024
C++

joeyy5588 / planning-as-inpainting

Star

Planning as In-Painting: A Diffusion-Based Embodied Task Planning Framework for Environments under Uncertainty

task-planning object-manipulation vision-and-language-navigation embodied-ai

Updated Dec 11, 2023
Python

joeyy5588 / LACMA

Star

LACMA: Language-Aligning Contrastive Learning with Meta-Actions for Embodied Instruction Following

vision-and-language-navigation embodied-ai

Updated Dec 3, 2023
C

raphael-sch / map2seq_vln

Star

Code for ORAR Agent for Vision and Language Navigation on Touchdown and map2seq

vision-and-language touchdown embodied-agent street-view vision-and-language-navigation vln map2seq

Updated Nov 3, 2023
Python

YicongHong / Discrete-Continuous-VLN

Star

Code and Data of the CVPR 2022 paper: Bridging the Gap Between Learning in Discrete and Continuous Environments for Vision-and-Language Navigation

computer-vision deep-learning visual-navigation vision-and-language vision-and-language-navigation embodied-ai cvpr2022

Updated Oct 31, 2023
Python

tsujuifu / model_aps

Star

Models of APS

computer-vision pytorch vision-and-language-navigation eccv2020

Updated Jun 19, 2023

marialymperaiou / knowledge-enhanced-multimodal-learning

Star

A list of research papers on knowledge-enhanced multimodal learning

knowledge-graph multi-task-learning visual-reasoning visual-dialog visual-question-answering vision-and-language multimodal-deep-learning visual-storytelling multimodal-retrieval visual-grounding visual-commonsense-reasoning vision-and-language-navigation story-visualization image-text-matching vision-language-transformer image-text-retrieval vision-and-language-pre-training conditional-image-generation knowledge-enhanced-multimodal-learning knowledge-enhanced-vision-language

Updated Dec 8, 2022

eric-ai-lab / FedVLN

Star

[ECCV 2022] Official pytorch implementation of the paper "FedVLN: Privacy-preserving Federated Vision-and-Language Navigation"

federated-learning privacy-preserving-machine-learning vision-and-language-navigation

Updated Oct 8, 2022
C++

PrithivirajDamodaran / vision-language-modelling-series

Sponsor

Star

Companion Repo for the Vision Language Modelling YouTube series - https://bit.ly/3PsbsC2 - by Prithivi Da. Open to PRs and collaborations

multimodal-interactions vision-and-language multimodal-deep-learning multimodal-representation vision-and-language-navigation vision-and-language-pre-training

Updated Aug 16, 2022
Jupyter Notebook

YicongHong / Recurrent-VLN-BERT

Star

Code of the CVPR 2021 Oral paper: A Recurrent Vision-and-Language BERT for Navigation

transformer bert vision-and-language pre-trained-model vision-and-language-navigation cvpr-oral cvpr2021

Updated Aug 13, 2022
Python

YicongHong / Entity-Graph-VLN

Star

Code of the NeurIPS 2021 paper: Language and Visual Entity Relationship Graph for Agent Navigation

deep-learning graph-neural-networks vision-and-language-navigation neurips-2021

Updated Oct 31, 2021
Python

YicongHong / Fine-Grained-R2R

Star

Code and data of the Fine-Grained R2R Dataset proposed in the EMNLP 2021 paper Sub-Instruction Aware Vision-and-Language Navigation

vision-and-language-navigation

Updated Oct 26, 2021
Python

batra-mlp-lab / vln-chasing-ghosts

Star

Code for 'Chasing Ghosts: Instruction Following as Bayesian State Tracking' published at NeurIPS 2019

vision-and-language neurips neurips-2019 vision-and-language-navigation vln

Updated Jan 10, 2020
C++

Improve this page

Add a description, image, and links to the vision-and-language-navigation topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the vision-and-language-navigation topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

vision-and-language-navigation

Here are 20 public repositories matching this topic...

intelligolabs / R2RIE-CE

Feliciaxyao / ICML2024-FSTTA

CrystalSixone / VLN-GOAT

GT-RIPL / robo-vln

eric-ai-lab / awesome-vision-language-navigation

daqingliu / awesome-vln

eric-ai-lab / Naivgation-as-wish

Gtothemoon / Contrastive-VisionVAE-Follower

joeyy5588 / planning-as-inpainting

joeyy5588 / LACMA

raphael-sch / map2seq_vln

YicongHong / Discrete-Continuous-VLN

tsujuifu / model_aps

marialymperaiou / knowledge-enhanced-multimodal-learning

eric-ai-lab / FedVLN

PrithivirajDamodaran / vision-language-modelling-series

YicongHong / Recurrent-VLN-BERT

YicongHong / Entity-Graph-VLN

YicongHong / Fine-Grained-R2R

batra-mlp-lab / vln-chasing-ghosts

Improve this page

Add this topic to your repo