工欲善其事,必先利其器(二)

前言 这里我主要讲讲为什么我要折腾本地搭建,了解相关知识: 好玩 了解大语言模型在应用上的基础原理(基本不涉及Transformer这种底层原理,仅仅是应用上的),有利于我们更好地使用线上的模型 免费,且大多数方案开源。对于有需求有能力的人来说,可以魔改一些东西,来满足自己的特定化工作场景/工作流 可以离线使用,这里可说道的就多了:隐私、自由、厂商价格歧视、广告投放等等,这些东西仁者见仁,我不展开,仅引用网上的一小段评论: 首先本地模型有一个好处就是不会缩减算力,云端服务明显就是会随着新一代模型发布,把旧模型能力通过缩减算力的方法压缩成本,然后再逼你使用更贵的服务,(OpenAI为什么涨价涨的那么熟练啊,你究竟涨过多少次价啊 其次就是云端模型上限制比较多,我之前在几个云服务上翻译一个关于中国卫星产业链的外国智库报告,因为出现了几个国资委相关的关键字,基本上几个国内的模型都不敢翻译。 第三就是隐私相关了,公司的内部资料你肯定是不能用外部大模型的,只能用内部部署的模型。 另外本文也仅作为一个超入门级的介绍,并不涉及非常深入的东西,比如不涉及模型的微调和训练,也不涉及图像、视频等多模态的形式。对于其中一些具体的应用场景,也不会将所有的选项尽善尽美的列举(有问题请参照官方文档),旨在抛砖引玉,分享我所了解的,激发所有同好的创造力,互相学习。 声明 LLM及其应用绝对是生产力的突破 我可能字里行间也许会透露出一些看上去对AI持负面意见的内容,但其实我个人还是非常喜欢并拥抱AI带来的变化的,这玩意儿确实是10年来我感受到的真正的科技突破(比5G、VR、苹果的M芯片、TWS耳机等都更明显),大多数人应该也是类似的想法。正是因为对此抱有希望,并且非常重视LLM可能带的技术、社会、文化影响,我们才会去“苛求”LLM有更强的能力,所以还请不要误解我对AI的态度。 我用Trae/Cursor 「Vibe Code」一些个人用的小项目,我用GPT/Grok尝试做文生图做视频的封面,我用DeepSeek/Perplexity做搜索引擎等等。每一项都让我感受到,从2022年GPT3.5横空出世以来,LLM及其应用的高速发展为生产力提升带来了无法想象的提升空间。 我的负面意见与其说是针对LLM本身,倒不如说是针对一些hype,或者是一些蹭热度的行为。LLM的快速发展毫无疑问是人工智能的一次突破 一些梗(负面) Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity We conduct a randomized controlled trial (RCT) to understand how early-2025 AI tools affect the productivity of experienced open-source developers working on their own repositories. Surprisingly, we find that when developers use AI tools, they take 19% longer than without—AI makes them slower. We view this result as a snapshot of early-2025 AI capabilities in one relevant setting; as these systems continue to rapidly evolve, we plan on continuing to use this methodology to help estimate AI acceleration from AI R&D automation. ...

July 5, 2025 · 2 min · ChaosNyaruko

Original 纳瓦尔的访谈 Quotes 你是否能从生活中获取你想要的,分别两部分 获得你想要的,知道如何去得到它 知道你想要的东西是正确的 社会上有很多安慰奖,那些奖品实际上并不值得拥有,实际上他们会带来新的问题和负担 人们经常到达一个自己不知道的地方,因为他们像自动驾驶一样,按照社会或别人的期望走,或者出于内疚,或者出于模仿欲望(imitate desire) 内疚是社会的声音在你脑海里说话,被社会编程,让你成为一个乖乖的“小猴子”,去做那些对部落有利的事。但我认为最好的结果,来自你深思熟虑后的选择 我觉得大多数人根本没花足够的时间去认真思考和做决定 很多事情的周期很长(很多年),但我们花在决定做什么和和谁一起做的时间却很短很短。 25%的时间来思考和决定(秘书定律:一个计算机教授在雇佣秘书的时候,研究发现大约花1/3于秘书任期时间去观察和决定,是最优策略,然后选择) 当人观察够了,对标准有了清晰的认识,然后任何达到或超过这个标准的人都算是合适的选择 约会、工作和职业选择都是一样的 但其实它不是基于时间的(不是1/3的时间),它是基于迭代的,关键在于你尝试的次数 回过头来一段失败的关系,可能最大的遗憾是一直待在那段关系里(很久才意识到应该早点离开,在你知道它不会有结果的那一刻就离开) 通过“一万次尝试”(虚指,类似一万小时定律,来自Malcolm Gladwell)来达到精通 迭代 不等于 重复 悲观是个难题 我们天生就容易悲观 悲观主义是进化的一部分 现代社会虽然有很多问题,但它比原始丛林要安全 现代社会由于杠杆效应,回报的上报很高 现代社会可以接触到大量不同的人,有很多尝试的机会,现代社会对失败宽容得多。我们要用理性的大脑去意识到这一点,去调整自己的思维方式。在现代社会,你更像是在运行一个搜索算法,去找到真正适合你的东西,而不是被一次失败困住。 一旦找到那个真正适合的选择,它会带来巨大的复利效应 一旦你找到适合共度一生的伴侣,你也可以在这段关系中实现“复利效应” 失败很多次也没关系,但关键是一旦你找到那个你注定要全力投入的生意,它将带来复利回报。 所以成为悲观主义者是没有意义的,你应该成为乐观主义者。但你应该对具体的事情抱怀疑态度,每一个具体的机会都可能会失败。但是在整体上,你应该保持乐观 怎么保持这种平衡呢?有点像心灵鸡汤,如果失败了,它是一次学习经历,它是一次迭代,只要我从中学习到了什么,反之才是失败。只要你不断迭代,及时止损,那么当你找到真正合适的东西时,你就要乐观,并让它产生复利效应。 所以不要一开始就盲目投入第一个机会,你不一定要和你约会的第一个人结婚(除非你很幸运)。你需要快速地探索和尝试,直到找到真正合适的选择。然后,你必须愿意全力以赴。两种方法都是必需的。 我也觉得这类标签,像“悲观主义者”“乐观主义者”“愤世嫉俗者”“内向外向”,这些都是自我限制,人类是非常动态的。 别管这些标签,最好还是专注于眼前的问题,以现实的面貌来看待它。在某种意义上,尽量把自己从这个问题中抽离出来。 你是参与其中没错,但动机性推理是最糟糕的推理方式,你无法通过过度自我驱动的推理找到真相(目的论?)。你必须保持客观,而客观意味着尽量把自己从其中抽离,保持一种中立的视角(正念?),或者至少尽量把你的个性从中抽离。 所以,你越是把自己深深地与某种身份和个性捆绑在一起,越会影响你的判断力。它会试图把你困在过去。 如果你说 “我是一个抑郁、不开心的人”,我就会不开心,这是把自己锁在过去的方法。哪怕是“我有创伤”“我有PTSD”。你是有一些记忆、闪回,偶尔也有不好的情绪,但 不要让它定义你自己,因为那样你就把它锁定为你的身份,结果只是不断地陷入循环。保持灵活更好,因为现实总是在变化,你必须能够适应它,适应能力也是一种智慧 适应是生存的关键,适应能力也是你能活到今天的原因之一(你的祖先也是适应者) 要适应,你需要清晰地看待事物。如果你通过自己的身份来看待事物,它会模糊你的判断力,影响你的决策

April 12, 2025 · 1 min · ChaosNyaruko

不要比较

给自己灌点鸡汤,大家共勉! 献给23届求学找工的同学–“Don’t Compare(不要比较)” from CS61A Fall 2019 Lecture 39 Video 4 Original English Version Short notes Freedom Think about what is worth working on, since you only have so much time. Do something matters to both the world and you) Fulfilling work work on something you are good at you like what you are working on useful to the world in some way You can take some time to find it, just keep looking around Power Don’t screw it up, we are building the world Create a world that lots of people can contribute to it The world we have today is due to contributions of millions of people who all did their part Self-Worth Don’t compare Out there in real life, how you compare to somebody else doesn’t matter much at all What does matter is what you are capable of, what you do, how you choose to spend your time, and what impact you have on the world. It turns out your self-worth has nothing to do with what other people achieve, it has everything to do with what you achieve I hope it sticks with you, and it’s not a good idea to spend your time comparing yourself to other people, and just focusing on improving yourself. ...

March 23, 2025 · 1 min · ChaosNyaruko

Disclaimer The original post was written by Andrew Gerrand on 13 July, 2010. I’m reposting it not because it’s “absolutely” correct, it just offers another perspective of concurrent programming, and in SOME case, it might be more suitable than “sharing memory” or “mutex stuff”. It may also help you appreciate some design philosophy of Go, and provide you with some inspiration when dealing with concurrency or other problems. Again I’m not saying it’s BETTER, it’s just another another way of thinking and designing. ...

August 30, 2024 · 5 min · ChaosNyaruko

How to measure execution time of function in golang, excluding waiting time

Two ways from StackOverflow Builtin Way Using “syscall” func GetCPU() int64 { usage := new(syscall.Rusage) syscall.Getrusage(syscall.RUSAGE_SELF, usage) return usage.Utime.Nano() + usage.Stime.Nano() } Explanation Utime: user CPU time Stime: system CPU time RUSAGE_SELF: means it’s measuring the “calling” process man 2 getrusage for more information NOTE: The documentation for syscall.Timeval suggests that Nano() returns the time in nanoseconds since the Unix epoch, but in my tests and looking at the implementation it appears actually to return just the CPU time in nanoseconds, not in nanoseconds since the Unix epoch. ...

August 30, 2024 · 2 min · ChaosNyaruko