Topic: visual-grounding Goto Github

Some thing interesting about visual-grounding

👇 Here are 45 public repositories matching this topic...

1989ryan / paragon

visual-grounding,[ICRA 2023] Differentiable parsing and visual grounding of natural language instructions for object placement

User: 1989ryan

robotics human-robot-interaction nlp visual-grounding

3dlg-hcvc / enet-scannet

visual-grounding,Helper tools for extracting and projecting ENet features to ScanNet pointclouds.

Organization: 3dlg-hcvc

2d 3d computer-vision visual-grounding

3dlg-hcvc / m3dref-clip

visual-grounding,[ICCV 2023] Multi3DRefer: Grounding Text Description to Multiple 3D Objects

Organization: 3dlg-hcvc

Home Page: https://3dlg-hcvc.github.io/multi3drefer/

3d computer-vision deep-learning visual-grounding clip cuda localization pytorch pytorch-lightning transformer

antonio-f / florence-2-test

visual-grounding,Florence-2 quick test

User: antonio-f

colab-notebook florence-2 huggingface-transformers image-captioning image-to-text jupyter-notebook multimodal-large-language-models python referring-expression-comprehension tutorial vision-foundation-model visual-grounding

antoyang / tubedetr

visual-grounding,[CVPR 2022 Oral] TubeDETR: Spatio-Temporal Video Grounding with Transformers

User: antoyang

spatio-temporal-video-grounding stvg vidstg hc-stvg vision-and-language multimodal-learning video-understanding visual-grounding

bwittmann / transformerrefer

visual-grounding,Utilizing a transformer-based object detector for the task of 3D visual grounding.

User: bwittmann

3d-point-clouds transformer visual-grounding

charles-xie / awesome-described-object-detection

visual-grounding,A curated list of papers and resources related to Described Object Detection, Open-Vocabulary/Open-World Object Detection and Referring Expression Comprehension. Updated frequently and pull requests welcomed.

User: charles-xie

awesome awesome-list open-vocabulary-detection open-world-object-detection referring-expression-comprehension visual-grounding

chenbarryhu / transformervg

visual-grounding,TransformerVG - 3D Visual Grounding with Transformers

User: chenbarryhu

transformer deep-learning visual-grounding 3d nlp

chenyunwu / phrasecutdataset

visual-grounding,Dataset API for "PhraseCut: Language-based Image Segmentation in the Wild"

User: chenyunwu

cvpr2020 datasets computer-vision umass-amherst vision-and-language visual-grounding referring-image-segmentation

chihyaoma / cyclical-visual-captioning

visual-grounding,PyTorch code for: Learning to Generate Grounded Visual Captions without Localization Supervision

User: chihyaoma

Home Page: https://arxiv.org/abs/1906.00283

captioning-images captioning-videos pytorch vision-and-language visual-grounding

compguesswhat / comp_probing

visual-grounding,Code used to train probing classifiers in the attribute prediction task

Organization: compguesswhat

Home Page: https://compguesswhat.github.io

allennlp dialogue neural-networks visual-grounding

curryyuan / phraserefer

visual-grounding,Toward Explainable and Fine-Grained 3D Grounding through Referring Textual Phrases

User: curryyuan

phrase-grounding point-cloud visual-grounding

curryyuan / zsvg3d

visual-grounding,[CVPR 2024] Visual Programming for Zero-shot Open-Vocabulary 3D Visual Grounding

User: curryyuan

Home Page: https://curryyuan.github.io/ZSVG3D/

3d vision-and-language visual-grounding zero-shot

daveredrum / d3net

visual-grounding,[ECCV2022] D3Net: A Unified Speaker-Listener Architecture for 3D Dense Captioning and Visual Grounding

User: daveredrum

Home Page: https://daveredrum.github.io/D3Net/

computer-vision natural-language-processing deep-learning point-cloud 3d caption-generation visual-grounding semi-supervised-learning eccv eccv2022

daveredrum / scanrefer

visual-grounding,[ECCV 2020] ScanRefer: 3D Object Localization in RGB-D Scans using Natural Language

User: daveredrum

Home Page: https://daveredrum.github.io/ScanRefer/

eccv computer-vision natural-language-processing 3d pytorch dataset deep-learning point-cloud visual-grounding

doc-doc / vrgv

visual-grounding,Visual Relation Grounding in Videos (ECCV'20, Spotlight)

User: doc-doc

visual-grounding spatio-temporal hierarchical region-graph visual-relation

gorjanradevski / text2atlas

visual-grounding,Codebase for "Learning to ground medical text in a 3D human atlas (CoNLL 2020)".

User: gorjanradevski

medical-natural-language-processing conll2020 bert-model nlp visual-grounding self-su

izhx / phrase-grounding-with-pronoun

visual-grounding,[EMNLP 22] Extending Phrase Grounding with Pronouns in Visual Dialogues.

User: izhx

Home Page: https://arxiv.org/abs/2210.12658

computer-vision phrase-grounding visual-dialog visual-grounding

jerryx1110 / awesome-rvos

visual-grounding,Referring Video Object Segmentation / Multi-Object Tracking Repo

User: jerryx1110

rvos segmentation video youtube-vos visual-grounding refer-segmentation multi-modal refer-vos multimodal-deep-learning refering-seg

jhkim-snu / pga

visual-grounding,[IROS 2024] PGA: Personalizing Grasping Agents with Single Human-Robot Interaction

User: jhkim-snu

multi-modal-learning personalization robotic-manipulation semi-supervised-learning vision-and-language visual-grounding

jianghaojun / awesome-3d-vision-and-language

visual-grounding,A collection of 3D vision and language (e.g., 3D Visual Grounding, 3D Question Answering and 3D Dense Caption) papers and datasets.

User: jianghaojun

3d-deep-learning computer-vision multimodal-deep-learning natural-language-processing point-cloud visual-grounding awesome 3d-vision-and-language

leaplabthu / pseudo-q

visual-grounding,[CVPR 2022] Pseudo-Q: Generating Pseudo Language Queries for Visual Grounding

User: leaplabthu

Home Page: https://arxiv.org/abs/2203.08481

computer-vision visual-grounding cvpr2022 deep-learning pytorch multimodal-deep-learning vision-and-language

lparolari / master-thesis

visual-grounding,Dissertation for "Weakly Supervised Visual-Textual Grounding based on Concept Similarity" (MS thesis at University of Padua, Italy) - PyTorch implementation: https://github.com/lparolari/weakvtg

User: lparolari

computer-vision deep-learning grounding visual-grounding phrase-grounding weakly-supervised-learning

lparolari / master-thesis-log

visual-grounding,A collection of resources (work logs, state-of-the-art scores, experiment trace, scripts and proof-of-concepts) for my MS thesis "Weakly Supervised Visual-Textual Grounding based on Concept Similarity" - https://github.com/lparolari/weakvtg

User: lparolari

visual-grounding deep-learning computer-vision

lparolari / master-thesis-report

visual-grounding,A quasi-final short and summary report on my thesis "Weakly Supervised Visual-Textual Grounding based on Concept Similarity". (MS thesis at University of Padua, Italy). - https://github.com/lparolari/weakvtg

User: lparolari

computer-vision deep-learning visual-grounding

lparolari / weakvtg

visual-grounding,PyTorch implementation of the model described my MS thesis: "Weakly Supervised Visual-Textual Grounding based on Concept Similarity" (https://github.com/lparolari/master-thesis)

User: lparolari

computer-vision deep-learning visual-grounding concept-similarity weak-supervision

marialymperaiou / knowledge-enhanced-multimodal-learning

visual-grounding,A list of research papers on knowledge-enhanced multimodal learning

User: marialymperaiou

conditional-image-generation image-text-matching image-text-retrieval knowledge-graph multimodal-deep-learning multimodal-retrieval story-visualization vision-and-language vision-and-language-navigation vision-and-language-pre-training vision-language-transformer visual-commonsense-reasoning visual-dialog visual-grounding visual-question-answering visual-reasoning visual-storytelling multi-task-learning knowledge-enhanced-multimodal-learning knowledge-enhanced-vision-language

multimodalgeo / geotext-1652

visual-grounding,An offical repo for ECCV 2024 Towards Natural Language-Guided Drones: GeoText-1652 Benchmark with Spatial Relation Matching

User: multimodalgeo

Home Page: https://multimodalgeo.github.io/GeoText/

drone-navigation geo-localization geotext natural-language-processing university-1652 vision-and-language visual-grounding

rhett-chen / robotic-grasping-papers

visual-grounding,paper list of robotic grasping and some related works

User: rhett-chen

grasp papers 6d-pose task-oriented-grasp semantic-grasp robotics visual-grounding general-grasp manipulation robotic-grasping

rorosonoio / visual-grounding

visual-grounding,Shortened version of the final exam for the Deep Learning course of the University of Trento in 2023.

User: rorosonoio

visual-grounding

scofield7419 / muie

visual-grounding,MUIE: Multimodal Universal Information Extraction

User: scofield7419

Home Page: https://haofei.vip/MUIE

information-extraction universal-information-extraction visual-grounding multimodal-information-extraction

seanzhuh / seqtr

visual-grounding,SeqTR: A Simple yet Universal Network for Visual Grounding

User: seanzhuh

Home Page: https://arxiv.org/abs/2203.16265

visual-grounding auto-regressive-models

svip-lab / lbylnet

visual-grounding,[CVPR2021] Look before you leap: learning landmark features for one-stage visual grounding.

Organization: svip-lab

cvpr2021 visual-grounding pytorch cvpr

tarasrashkevych99 / visual-grounding

visual-grounding,This is a deep learning project focused on the visual grounding task

User: tarasrashkevych99

clip deep-learning visual-grounding

theshadow29 / awesome-grounding

visual-grounding,awesome grounding: A curated list of research papers in visual grounding

User: theshadow29

computer-vision natural-language-processing grounding awesome-list papers arxiv visual-grounding image-grounding video-understanding video-grounding

theshadow29 / vognet-pytorch

visual-grounding,[CVPR20] Video Object Grounding using Semantic Roles in Language Description (https://arxiv.org/abs/2003.10606)

User: theshadow29

grounding visual-grounding video video-object-grounding pytorch-implementation vision vision-and-language nlp object-grounding video-grounding

timbmg / belief

visual-grounding,Implementation of Master Thesis on "Belief State for Visually Grounded, Task-Oriented Neural Dialogue Model"

User: timbmg

nlp dialogue dialog deep-learning machine-learning nlproc neural-network neural-networks pytorch visual-grounding

uvavision / selfeq

visual-grounding,[CVPR 2024] Code for "Improved Visual Grounding through Self-Consistent Explanations".

Organization: uvavision

Home Page: https://catherine-r-he.github.io/SelfEQ/

cvpr2024 grounding visual-grounding

xuyang-liu16 / vgdiffzero

visual-grounding,[ICASSP 2024] VGDiffZero: Text-to-image Diffusion Models Can Be Zero-shot Visual Grounders

User: xuyang-liu16

Home Page: https://arxiv.org/abs/2309.01141

computer-vision vision-language-model zero-shot-learning stable-diffusion text-to-image-generation visual-grounding

yangli18 / vltvg

visual-grounding,Improving Visual Grounding with Visual-Linguistic Verification and Iterative Reasoning, CVPR 2022

User: yangli18

visual-grounding vision-language visual-linguistic cross-modal

yanmin-wu / eda

visual-grounding,[CVPR 2023] EDA: Explicit Text-Decoupling and Dense Alignment for 3D Visual Grounding

User: yanmin-wu

3d-visual-grounding 3d-vision-and-language visual-grounding vision-and-language

yuechengithub / visual-grounding

visual-grounding,HAIS_2GNN: 3D Visual Grounding with Graph and Attention

User: yuechengithub

machine-learning deep-learning nlp 3d visual-grounding gnn scanrefer instancerefer

zjukg / duet

visual-grounding,[Paper][AAAI 2023] DUET: Cross-modal Semantic Grounding for Contrastive Zero-shot Learning

Organization: zjukg

Home Page: https://arxiv.org/abs/2207.01328

pretrained-language-model pytorch transformer zero-shot-learning cross-modal grounding semantic knowledge-transfer visual-grounding

zlccccc / 3dvg-transformer

visual-grounding,[ICCV2021] 3DVG-Transformer: Relation Modeling for Visual Grounding on Point Clouds

User: zlccccc

3d-vision pytorch scanrefer visual-grounding iccv2021

zlccccc / 3dvl_codebase

visual-grounding,[CVPR2022 Oral] 3DJCG: A Unified Framework for Joint Dense Captioning and Visual Grounding on 3D Point Clouds

User: zlccccc

3d-vision cvpr2022 dense-captioning pytorch visual-grounding scanrefer 3d-vision-and-language 3d-visual-grounding deep-learning 3d-visual-question-answering 3d-vqa

Topic: visual-grounding Goto Github

👇 Here are 45 public repositories matching this topic...

1989ryan / paragon

3dlg-hcvc / enet-scannet

3dlg-hcvc / m3dref-clip

antonio-f / florence-2-test

antoyang / tubedetr

bwittmann / transformerrefer

charles-xie / awesome-described-object-detection

chenbarryhu / transformervg

chenyunwu / phrasecutdataset

chihyaoma / cyclical-visual-captioning

compguesswhat / comp_probing

curryyuan / phraserefer

curryyuan / zsvg3d

daveredrum / d3net

daveredrum / scanrefer

doc-doc / vrgv

gorjanradevski / text2atlas

izhx / phrase-grounding-with-pronoun

jerryx1110 / awesome-rvos

jhkim-snu / pga

jianghaojun / awesome-3d-vision-and-language

leaplabthu / pseudo-q

lparolari / master-thesis

lparolari / master-thesis-log

lparolari / master-thesis-report

lparolari / weakvtg

marialymperaiou / knowledge-enhanced-multimodal-learning

multimodalgeo / geotext-1652

rhett-chen / robotic-grasping-papers

rorosonoio / visual-grounding

scofield7419 / muie

seanzhuh / seqtr

svip-lab / lbylnet

tarasrashkevych99 / visual-grounding

theshadow29 / awesome-grounding

theshadow29 / vognet-pytorch

timbmg / belief

uvavision / selfeq

xuyang-liu16 / vgdiffzero

yangli18 / vltvg

yanmin-wu / eda

yuechengithub / visual-grounding

zjukg / duet

zlccccc / 3dvg-transformer

zlccccc / 3dvl_codebase

Recommend Projects

Recommend Topics

Recommend Org