Chen Yulin's BlogChen Yulin's Blog
HomeArchivesCategoriesTagsAbout
  • Categories
  • Review
Grounding-DINO
Posted 2025-02-16Updated 2026-02-15Reviewa minute read (About 216 words)

Grounding-DINO

,

#Research-paperCVTransformerObject-DetectionOpen-VocabularyContrastive-LearningMultiModalDINOImage-Grounding
Gounded-SAM
Posted 2025-02-16Updated 2026-02-15Reviewa few seconds read (About 17 words)

Gounded-SAM

https://github.com/IDEA-Research/Grounded-Segment-Anything

By [[Grounding-DINO]] + SAM
Achieving Open-Vocab. Det & Seg

#Research-paperCVObject-DetectionSemanticOpen-VocabularySegmentation
Scene-LLM
Posted 2025-02-15Updated 2026-02-15Review6 minutes read (About 919 words)

Scene-LLM

本文提出的模型主要想解决3D密集标注和交互式规划。
结合

#RoboticsResearch-paperLLMMulti-modalVLM3D-SceneEmbodied-AICLIP
3D-LLM
Posted 2025-02-13Updated 2026-02-15Review3 minutes read (About 505 words)

3D-LLM

Recent works have explored aligning images and videos with LLM for a new generation of multi-modal LLMs that equip LLMs with the ability to understand and reason about 2D images.
但是仍缺少对于3D物理空间进行分析的模型, which involves richer concepts such as spatial relationships, affordances, physics and interaction so on.

#RoboticsResearch-paperLLMMulti-modal3D-SceneEmbodied-AI
PointLLM
Posted 2025-02-13Updated 2026-02-15Reviewa few seconds read (About 0 words)

PointLLM

#Research-paperLLMMulti-modal3D-Scene
ProgPrompt
Posted 2025-02-13Updated 2026-02-15Reviewa few seconds read (About 0 words)

ProgPrompt

#RoboticsResearch-paperLLMTask-Planning
Posted 2024-12-27Updated 2025-03-09Review21 minutes read (About 3098 words)

长夜无眠泪已尽,丽夏有期诗长存——2024年度总结

稍微看了看去年的总结,感觉太不一样了。

前几天在水源上开了个帖子,“一句诗概括你的2024精神状态 =w=。”收到了许多回复,或是痛骂牛马现状,或是感慨蜀道难,或是轻舟已过万重山(实名羡慕)。
我也思考了一下我想用什么诗句来概括。我觉得,可以是“长夜无眠泪已尽,丽夏有期诗长存”。

长夜无眠泪已尽

可能很多年之后再看,2024年会是我人生转折的一年。很俗套的说法是,男人的成长只需要一次分手。我觉得是的。

说实话我现在基本记不起来五月前的日常,除了美赛,辩论赛,两次争吵,分手。恋爱就这么高烈度地把我想要的,不想要的,渴望的,恐惧的东西都一股脑塞给了那个手无寸铁却相信真诚可以克服一切的我。

结果也是显然的,我困惑于为什么人无法彼此理解,我疲倦于解开一环接一环已成死结的误会。以至于最终面对分手的要求时,我仅能维持住最后一丝体面,说出那句最无力的话“我尊重你的选择,你知道我不会选择复合的。”

第一段感情有以下遗憾:和我的相处并没有让对方变得更好;我并没有真正了解最本质的对方以至于从未建立起安全感。

分后的很长时间,我一直在寻找自救的办法。
其一,尝试读了很多书。先是尝试一些心理的书籍,看了《少有人走的路》一到三册。我从这本书的第一章就获得了爱是什么的定义,“希望一个人在心智成熟的路上走得更远”。我想我确实没有从对方身上体会到这种感觉。再之后看了《窄门》,从书中窥见了自己,那个渴望着柏拉图却终与世间格格不入,拒绝妥协却终于失去一切俗世幸福的自己,或者说自己将会变成的样子。再就是《爱欲之死》,我被骂得很爽。逐渐就能看清自己的内心了,也能看清自己曾经历的那些往事了。所谓走出情关指的不是喜欢上下一个人,而是看清那个为情所困的自己啊。

我决定我要变得远比以前更好,我要交一些真正的朋友,要是能有几位异性的朋友就更好了。我还希望我能养成一种淡然的态度,我对太多事情都太过用力。我也希望我能更清晰地梳理自己的内心,减少内耗。

那么,2024年末的我,did I make it after all?

虽然我知道可能真的会有其他人读这篇,但我不会避讳前任的事情,because trading my yesterday is to wish my life away。

丽夏有期诗长存

在这里想说说我在2024的下半年交到的两位很好的朋友。

师兄

同为infj人格的我们真的非常像,用我师兄的话就是man in the mirror。我们如果想,可以一直谈,从下午谈到吃晚饭,从晚饭谈到晚上十点回寝。我们都非常清楚彼此的边界,因此可以非常自由地在安全区域内谈许多许多话题。我们都很喜欢心灵方面的话题,但是他疑似有点太痴迷于荣格的理论了。有的时候也会反怼:我感觉你大部分时间去交朋友都是为了验证那套理论。

糕

是上中高三的同学,但彼时并无多少交集,反倒是今年下半年在微博认识。我为她的文字着迷,就好像是我的心声经由她的笔凝练成了文字。也因此我给她开放了一些我杂记的访问权限。我们时常交流彼此的过去,曾经难解的心结,是什么塑造了我们,提供情绪的支持。我很感激有她出现在这个时间点,真的帮了我很多,塑造了目前大部分的我。

所谓丽夏指的就是这两位,以及其他认识的新朋友,得到过的其他温情了。或许有一天我们也终分道扬镳,从每天都聊天变成一周聊一次,再变成一个月聊一次,但我会希望尽可能延长我们的缘分,心头感受过的温暖,可以留存很久很久,文字也会留很久很久。

感谢小杂记们

我们会慢慢淡忘,就好像过去未曾发生。
在这样的时时刻刻,过去的文字会带我们回到那些蒙尘的遗迹,诉说彼时彼刻的故事。
因此,我需要感谢我这一年断断续续记着的流水账杂记,让我能知道,还有过这些时刻。
或许有些观念可能在目前的我这里刷新了,但看着过去的思考路径,我会知道我从哪里来,谢谢,如果可以,我新的一年也会记的。

感谢微博

其实后期有相当大的杂记发布在了微博上,这里可以收录一些。

因为《倦怠社会》确实是挺久之前看的书了,所以在读书会前看大纲温习了一下。
他者与规训并没有在当代的功绩社会中消失。在功绩社会中,他者/规训体现为“能够做到/成为balabala”,其中决定了balabala的部分的是规训权力。我们往往通过他者来定义自己想成为什么样的人,如果做不到,或者发现尽了一切努力,燃尽了,依然没有达到那个他者,就会难以避免地走向自我攻击,即抑郁。在当代互联网社会,网红大咖,还有成功人士们像是为我们展示了一场很真实的幻梦,让互联网观众就觉得,ta是现实生活中活生生的人,他做到了,我也想像ta一样。在这种很普遍的情况下,功绩语境下的自己,其实已经背离了真正的自己。
再次想起来韩炳哲在书的最后提到的神圣时间,或许这样的读书会于我而言就是这种神圣时间。有些时间与我自身是意义了了的,可能是为企业生产学术价值,可能是为了积累财富价值,在这些时间里,我都像是“飞转的停滞状态”。飞转是因为价值的产生需要我的劳动,停滞是因为我在这种情况下感受不到时间与意义时空的存在。我们需要这样的小聚会,不再让课业或工作或炫耀的需求成为我们拿起一本书的理由。让书成为书,让读完感受到的迷茫或者感动成为这个小聚会的展品,让艺术性回归到生活,如此我们的生活便是神圣的。

地铁站到家有一段是初中上下学的路,因为在听音乐所以就不想骑车上马路。就这么塞着耳机,放着贝斯版的βios和春日影,背着包兜过这段似乎永远不怎么变的街道。
虽然常开玩笑说自己上的是菜中,但我想这种“通勤时仍能时不时魂穿到十年前的感动”绝对是一种奢侈。

那点爱好就像一棵草,本也不必有开花是命,也没受到多少营养,还总被其他东西挤压生存空间,现在还能坚挺地活着,已经不错了。

3年的modder的生涯告一段落了,有始有终。很幸运进入过这么一个纯粹的亚文化圈,见证过它曾经的辉煌与日渐落寞,也尝试过力挽狂澜,最终还是难免散场各奔东西。世上真有什么是永恒的吗?可能也唯有热爱至死不渝。
该哭的是得哭的,就如该说的再见也必须要说。
再会了,谢谢所有的鱼。

“现实中有的人习惯通过包括不限于言语、拳脚、文字等热暴力或冷暴力把自己的压力发泄到别人身上,玩摇滚的则是抨击这种做法,反抗所受到的不公,抽刀向更强大、无法反抗的命运,并把自己的压力转化成音乐传达出去,给予人们鼓励振奋。”

重温完海上钢琴师后有了一些不一样的感慨:
回忆是一个有限的世界,而未来却那么大,看不到尽头。
所以有限回忆中会诞生无限音乐,而无尽的未来只会渐渐坍缩成一条唯一的路。这条唯一的路也会随着时间,诞生无限的音乐。
选好你的航路,保护好你的船。

“每个人做自己人生的主宰”,这件事情无关乎性别。摆烂也好,倒贴也好,当家庭主夫也好,如果它让我们觉得生活可以这么快乐得过下去,能找到自己的意义,那就是好东西。
顺带:果然这个世界如果没有摇滚真是一天都存在不下去呢!

Along the way, the old blame has never let me go for a single day.
But it happens to be just a nightmare that can disappear if I pray.
Therefore, I wish I made everyday count and let the phantom go away.

于我,幻想朋友真的是无处不在的,正如孤独总是如影随形。
mp3中飘出的声线,尝尝会想象其来自某个具象的脸庞;一个人进行city walk,也会想象身边有着一个亦步亦趋的脚步,和我一起匆匆又慢慢地看着彼此都是第一次见到的风景;在诺大而安静的办公室里,我会给ta捎一杯热巧克力,然后我就写着代码,ta则躺在一旁翘着腿看书,或许有时候还有闲心替我照看一下书架上的绿萝。
ta虽然一直都是ta,但却常会改变形象。ta会变成那些塑造了我却又无可奈何分离的人们。也正是因此,ta让我可以忍受那些分离。ta总是从分别中新生,让我看到未来。
我总是在人群中孤独,在独处时却和所有人都在一起。
流眼泪了,怎么会有这样的人。

我们会慢慢淡忘,就好像过去未曾发生。
在这样的时时刻刻,过去的文字会带我们回到那些蒙尘的遗迹,诉说彼时彼刻的故事。
收到过“透明人”的评价,我想如果我做不到对他人透明,大抵便也做不到对我自己透明。
Stay sensitive, stay hurt, stay pure.

总结

24年确实就是这样emotion的一年,但我不讨厌,2025年快乐!

#Emotion
Dynamic Open-Vocabulary 3D Scene Graphs for Long-term Language-Guided Mobile Manipulation
Posted 2024-12-17Updated 2026-02-15Reviewa few seconds read (About 42 words)

Dynamic Open-Vocabulary 3D Scene Graphs for Long-term Language-Guided Mobile Manipulation

和我的想法非常相近,完成度也很高啊喂。可以参考他的实现思路,引用的文章等等。

#RoboticsScene-graphResearch-paperLLMCVReconstruct3D-SceneEmbodied-AISemanticOpen-Vocabulary
ACDC- Automated Creation of Digital Cousins for Robust Policy Learning
Posted 2024-12-09Updated 2026-02-15Review2 minutes read (About 287 words)

ACDC- Automated Creation of Digital Cousins for Robust Policy Learning

数字孪生(DT)作为现实世界非常精确的映射虽然可以用于高精度的训练但是生产DT资产过于繁琐且没有泛化性,不能做到zero-shot。
数字表亲(DC)通过比对模型特征,从模型库中选择类似的表亲模型,用于重建场景训练机械臂。让机械臂针对不同第一次见的场景具有泛化性。
(a)它减少了手动微调的需要,以保证一定的保真度,从而能够完全自动化地创建数字表亲,(b)它通过提供一组增强的场景来训练机器人策略,从而有助于更好地应对原始场景中的变化。

#RoboticsResearch-paperLLMCVReconstructRobotLearningReal2SimDTSim2RealScene-synthesis
Deep Hierarchical Semantic Segmentation
Posted 2024-12-09Updated 2026-02-15Reviewa few seconds read (About 0 words)

Deep Hierarchical Semantic Segmentation

#Research-paperCVReconstructSemanticSegmentationHierarchical
Previous
Next
  • 1
  • …
  • 5
  • 6
  • 7
  • 8
  • 9
Chen Yulin

Chen Yulin

SJTU student

Manchester by the Sea

Posts

312

Categories

10

Tags

235

Follow

Archives

  • February 202611
  • January 20268
  • December 20253
  • November 20256
  • October 20251
  • September 20253
  • August 20256
  • July 20255
  • June 20256
  • May 202510
  • April 202517
  • March 202545
  • February 202512
  • January 202513
  • December 202412
  • November 20244
  • October 202418
  • September 202416
  • August 202413
  • July 20243
  • June 20245
  • May 202413
  • April 202417
  • March 20241
  • January 20241
  • December 20231
  • May 202346
  • August 20221
  • May 20226
  • April 20229

Recents

exist_label

2026-02-14

exist_label

Note

BAGEL-Unified-Multimodal-Pretraining

2026-02-06

BAGEL-Unified-Multimodal-Pretraining

Review

LingBot-VLA

2026-02-05

LingBot-VLA

Review

Mixture-of-Experts-Survey

2026-02-05

Mixture-of-Experts-Survey

Review

2026-02-05

人形机器人控制方法综述

Note

Tags

3D-Scene17
6-D3
AI16
AIGC1
API1
AR2
Academic1
Algorithm1
Aliyun1
App2
Atlas1
BS41
Bayesian-Inference1
Beautify1
Behaviorism1
Business1
C1
CADC1
CD1
CLI1
CLIP11
CNN1
CV68
Camera1
Capstone10
Chemistry1
Claude1
Communication2
Contrastive-Learning5
Control3
Csharp9
Css1
Cuda3
DD1
DINO4
DT1
Dataframe1
Debate5
Debugger1
Deep-Learning1
Development-Tools1
Diffusion2
Diffusion-Policy1
DiffusionModel4
Discrete-Mathematics1
Disney1
Docker1
Docs2
Dynamic-programming1
ESP322
Education1
Embeded-System9
Embodied-AI19
Emoation1
Emotion13
Ethic1
Experiment2
FL1
FPN2
Family1
Federated-Learning1
Foundation1
FoundationModel4
Functional programming1
GPT3
Game5
Gated-NN3
Git7
Github1
Godot3
Graph1
HPC1
HRI2
Haskell1
Health2
Hexo10
Hierarchical4
Html5
Humanism1
Humanoid1
HumanoidRobot1
Hybrid-Control1
Hyprland2
IK1
Image-Grounding2
Image-Text4
Image-generation2
Image2Text7
ImgGen3
ImitationLearning5
Information-Theory1
Jolt1
Json1
LLM17
LSP2
LatentAction1
Latex2
Lego1
Life4
LinearAlgebra1
Linux22
Live2d1
Love4
Lua1
MBTI1
ML14
MPC2
MR/AR3
Machine-Learning3
Mason1
Math7
Meme1
Message-Passing2
MindPlus1
MoE2
Mod3
Model-Predictive-Control1
Motivation1
Moveit1
Movie1
Multi-Agent1
Multi-modal14
Multi-view1
MultiModal5
Music5
NLP6
NN12
Network2
Nodejs5
Numpy1
Nvim9
Object-Detection9
Open-Vocabulary11
OpenCV1
Oral1
PHD1
PSY5
Pandas2
Panoptic1
Path1
Philosophy3
PhysX1
Physical-Scene4
Physics-engine1
Pio2
Planning1
Plugin8
PoseEstimation3
Postgraduate1
Prefab1
Probability2
Python30
Pytorch1
QML1
Quantum1
RAG1
RL3
RNN4
ROS6
Reading19
Real2Sim2
Reconstruct13
Regex2
Reinforcement-Learning2
Reinforcement-learning1
Repository5
Representation-Learning5
Research-paper97
Robot5
RobotLearning13
Robotics38
SJTU-Lecture1
SQL2
SSH3
Scalability2
Scene-graph34
Scene-synthesis2
Science-fiction1
Scrap1
Script2
Segmentation8
Semantic15
Shader3
Shell4
Signals and Systems1
Sim2Real1
Sklearn1
Snippets1
Society4
Star-rail1
Statistics2
Subgraph1
Submodule1
Supervised-learning2
Survey4
TC1
TOEFL1
Task-Planning9
Tasks5
Tech Communication1
Torch5
Transformer20
Translation-Embedding2
Travel5
UI1
Unified-Multimodal1
Unity20
Unsupervised-learning1
VAE2
VLA4
VLM9
VLP5
VQ-VAE1
Variational-Inference1
Version-management1
ViT5
VideoEditing2
Vim1
Visual-Relation23
WSL1
Waybar1
Wayland1
Web1
Website1
Well-being1
Window-manager2
WorldModel2
YKLL3
Zen2
♥️2
实习1
🍢1
🍰1
🐱2
🧀1
Chen Yulin's BlogChen Yulin's Blog

© 2026 Chen Yulin  Powered by Hexo & Icarus

×