Terry Wang
2024-05-10

量子物理如何让我更自洽

Helgoland cover

最近读了一本科普读物《量子物理如何改变世界》,这本书在豆瓣2023年度科学·新知图书榜单排名第三,作者是意大利理论物理学家卡洛·罗韦利。

这本书篇幅短小,只有200多页,前一半主要讲量子理论的发展和核心思想,后一半讲我们应该以何种方式去思考和理解量子理论。因为量子理论和我们的日常生活经验相差悬殊,作者引用了多种哲学观点来阐释其正确打开方式,这让本书的后半部分具有强烈的哲学意味。

事实上,作者的核心观点之一就是量子理论可以统一物质世界与精神世界 —— 它们本质上都是不同实体间的相互关系。现实只不过是一张由事件编织出来的互动关系网。

我发现这样的思维方式可以印证很多宏观层面的观点。

举几个例子。

一、没有绝对的、普适的观点。年纪越大,见过的人越多,就越能理解这句话。任何观点上的差异都是视角不同罢了。理解他人和世界建立联系的方式,能帮我们拼凑出更为全面的现实图景。

二、过去不决定未来,世界是概率性的。做产品的时候,我们常常有那种“顿悟”瞬间,以为自己抓住了某种因果规律,锁定了系统中的确定性,但把这个确定性推而广之时又发现行不通。世界上没有确定的存在。

三、认知只是一种映照,“我”是什么,直接影响了我的认知是什么。不同人读同一段文字的感受不同,看同一轮明月的情绪各异。“我”的概念,也是由关系所定义的。我们对现实的看法也是现实的一部分。

四、学习的最好方式是边干边学,通过与具体问题的互动去理解它,解决它。这个过程中所出现的事实会帮我们调节脑内的概念结构,让知识、能力真正内化。

“量子力学理论是迄今为止唯一一个未曾犯过错误,且在其应用范围方面尚未发现局限的认知世界的基本理论。”

也许物质微粒、量子风暴离我们的生活过于遥远,但是了解世界的构成方式,以及怎么去思考和看待它,却能对我们的生活和学习产生重要影响。

当然,这样的观点本身,也仅仅是“我”与这本书之间的相互关系。

2024-05-10

Apple Ads

为了展现新 iPad Pro 的强大,Apple 发布了一个令人极度不适的广告片 Crush!

碾碎所有代表人类创意的美好事物换来一台 iPad 这样一个事实,明白无误地提醒了我们,在追求数字化、高科技的路上,我们失去了多少美好。

有网友说 “iPad crushes the soul of humanity”,振聋发聩。

几个月前,一支宣传 Apple “碳中和”成绩的广告片 Mother Nature 也让人觉得非常诡异。

所以你不禁会想,Apple 这是怎么了,这种变化是从什么时候开始的,当这个三万亿美金巨头跌倒的那天,这些诡异的广告是否会被当作一种前兆。

2024-04-27

在 Macbook 上运行 Phi-3

Phi-3-mini 是微软发布的一个小语言模型,有38亿参数,主打一个体积小,能在端侧流畅运行,并且效果不错。

今天试着在自己的 Macbook 上跑了一下。

主要用到了一个开源的工具 Ollama,这个工具把在本地运行模型的流程做到了“傻瓜式”。除了 Phi-3 外,它还支持许多主流开源模型,包括 Llama 3, Mistral, Gemma 等。

Ollama website

从官网下载 Ollama 安装包后一路点下一步进行安装。

之后打开终端,运行一个命令 ollama run phi3 系统就会自动下载 Phi-3 并安装。这个模型体积只有2.3GB,比我预想的小很多。

安装完成后,终端里会出现一个交互界面,在这里就可以直接开聊了。

Install complete

用起来第一感觉是速度非常快。对简单问题的回答也比较令人满意。

Q&A in terminal

终端里给出答案无法格式化 markdown 的内容,这可以通过给它套一层 Web UI 来解决。

开源社区也有解决方案,比如 Open WebUI 就可以与 Ollama 无缝集成。根据 Github 上的说明安装好之后(需要预先安装 Docker,之后也是执行一条命令),就可以通过浏览器访问运行在本地的 Web 聊天界面了。

Open WebUI screen

整体操作下来,感觉现在围绕大模型应用的工具链真的很成熟了,对新手很友好。而且在本地跑模型和直接调用 API 时的感受很不一样,看到它吐出答案的那一刻,很难想象 LLM 这样强大的技术竟然可以在自己的笔记本电脑上运行起来。

2024-03-27

AI devices

Rabbit R1

Rabbit R1. 售价 $199。据报道已经收到10万个预订单。

AI Pin

AI Pin. 售价 $699/$799。暂无销售数据。

两个产品都计划于今年三四月份发布。

感觉AI技术还没有达到产品 demo 里演示的成熟程度,因此很好奇这两个设备到底会惊艳用户,还是只是骗人的。

2024-02-28

包括 Sam Altman 在内的许多人对 AI 的评价是:现在 AI 只能取代任务(task),还不能取代工作(job)。

我认同这个观点,还可以从这个观点得到几个推论:

  • 工作里除了任务还有其他活动
  • 如果一个人只会做任务,那他大概率会被 AI 替代
  • 学会区分任务和工作是很重要的
  • 如果把完成任务看作时间轴上的一个个块,是不是填满块间空隙的东西才使得工作成为工作?那些填满空隙的东西是「思考」吗?
2023-12-06

Books 2023

罗列一下2023年读的书,觉得很好的做了标记。

2023-11-10

前段时间看到 luke 说自己做了一个演讲,题目是 How AI ate my website,想听听看,但一直没找到视频。

过了几天,看到了 OpenAI DevDay 的视频,看 Sam 三下两下把自己写过的文章喂给 ChatGPT,创建了一个创业导师机器人。突然想到 luke 应该也是做了类似的事吧。只不过他是在 DevDay 之前做的,那时候还没有这些新工具。

进而想到 luke 当年因为写了表单设计相关的书出名,以后要是都变成聊天式 UI,就没有表单什么事了吧。

充满了模糊性的 LLM 竟然能很好的理解人类用模糊的语言描述的需求,让我们终于有希望摆脱各种繁琐的在线表单,这一点挺神奇。

2023-11-07

AI 的未来:个性化通用智能

我在上一篇文章《AI 带来的机会》里的观点是,更多的机会在 AI 应用上,我们应该着眼于应用领域的颠覆式创新。

行业内普遍的预测也类似:基础模型厂商会收敛到三家左右,更多机会(尤其是新公司的机会)在应用层,未来会有越来越多的 AI 原生应用出现。

什么才是 AI 原生应用呢?为什么没看到市场上出现很多所谓的 AI 原生应用呢?为什么行业看上去日新月异,但新公司在 AI 应用领域找到机会这么难呢?

AI 在应用中的角色

仅仅把 ChatGPT 看作一个技术创新是不合适的,它本身就是应用层面的颠覆式创新,它把大语言模型的能力进行了恰当的包装,占领了一个新兴市场。而 OpenAI 同时掌握着开发者平台,基于它的接口开发出来的类 ChatGPT 产品,总避免不了给人留下「套壳 OpenAI」 的印象,无法与 ChatGPT 竞争。

生成式 AI 技术催生的产品竞争还停留在功能阶段。如果我们认可「功能决定形式」,那么追求在交互或者设计上进行差异化就是伪命题。一来受到功能制约,也做不出来很不一样的交互方式,二来用户在选择这类产品时,还是以功能为主。等 AI 技术比现在「普惠」很多时,用户关注的重点才会从功能转移到可靠性、便利性和价格上。

既然 AI 原生应用还没有明确的定义,也许可以通过一个产品里的「AI成分占比」来大致判断它是不是接近 AI 原生。

Assistant API

OpenAI DevDay 给了一个旅行助手的例子,演讲者通过自然语言给出指令,AI 判断该做什么,然后通过调用函数、写代码计算去完成用户的指令,最后通过用户熟悉的图形用户界面给出反馈,比如标记地图等。这个体验很好的桥接了聊天式 UI、AI 和传统 UI,打开了很多关于 AI 原生应用的想象。

但这样的产品是以 OpenAI 刚发布的新模型作为支撑的,新公司很难做出这样的产品。模型能力和产品能力,可以说是一体两面。

行业模型的发展

有一种说法是,在基础模型之上,会有一些厂商来训练行业大模型,帮助企业更好地完成任务。我对此持怀疑态度。对于定制化模型的需求可能是阶段性的,甚至是伪需求。随着基础模型能力不断增强,训练行业大模型的边际收益会逐渐降低,直到低于成本。或者说,未来的基础模型能力会如此之强,以至于只需要一点点改造就能满足不同行业的需求。

我觉得 AI 技术实施可能是一个颇有前景的行业,就像当年 ERP 支撑了很多技术实施公司一样。不过这个市场目前还不成熟,还有很多因素阻碍企业引入 AI 技术,例如大模型的商业价值不够清晰、企业本身数字化基础不完善、对信息安全的担忧等。

data

OpenAI DevDay 给了一个数据,92% 的世界五百强企业已经在利用 OpenAI 的平台开发产品了。如果我们把这些大公司的行为看作 leading indicator, 那就有理由相信,引入 AI 技术将会成为企业数字化转型后的又一个浪潮。

隐私问题

在个人层面和企业层面都有对隐私的担忧。如果要支持个性化,就要把隐私数据分享给AI,这安全吗?

其实现实生活中已经有很多这样“暴露隐私”的关系了,比如秘书、家庭保姆、月嫂、私教、律师、投资顾问等,如果能放心的把隐私数据交给他们,那交给 AI 又有什么不放心的呢。

因此在谈论隐私时,一定要具体一点。比如,上班时每天的日程安排算不算隐私,靠秘书来安排会议,做会议记录,算不算暴露隐私。我们个人的健康数据算不算隐私,透露给医生算不算暴露隐私。我们对秘书和医生的信任从何而来,我们有没有可能与 AI 也建立起那种信任。

隐私安全问题的背后,是对掌握如此强大技术的机构的怀疑。在 Bloomberg 对 Sam Altman 的一个访谈中,也提到了信任问题。Sam 说 OpenAI 的一个重大课题就是怎么把这项技术的发展和使用「民主化」到全世界的人,例如对齐数据该如何选取等。他觉得重要的是看 OpenAI(或者其他组织)在这方面有什么行动,而不是仅仅依靠「信任」二字。

个性化与技术容器

GPTs / bots 是一种推动技术应用的方式,通过更具体的 bot,降低人们认识和使用 AI 技术的门槛,让一个人可以驱使不同 bot 完成不同的任务。但如果每个人都有专属的通用 bot 岂不是更好?

AI 技术目前仍栖身于电脑、手机、汽车、音箱、电视这些智能设备中,如果有更适合它的容器,岂不是更方便?

Ai Pin

Humane 就是这样一家试图打造 AI 驱动的下一代智能设备的公司,他们的第一款产品 Ai Pin 也即将发布。我很赞同企业创始人的一个观点 — 我们的未来一定不是更多屏幕,而是让技术“消失”。

让我们拭目以待。

(完)

参考资料

2023-10-10

AI 带来的机会

AI 的第一波热潮已经过去,大模型的主要玩家逐渐浮现,技术方向也更加明确:多模态、人机对齐、降低训练成本、提高可解释性等。这些工作将逐渐集中到少数大模型公司和开源社区。

投资方面,仍然会涌入硬件、基础设施、基础模型能力,以推动技术进步。然而,这些投资的前提是 AI 应用必须能够创造巨大的经济价值,以实现合理的回报。因此,大多数公司将把注意力集中到应用场景上,逐渐从技术驱动创新转向产品驱动。

成熟企业可以将大模型和 AI 能力视为「延续性创新」的工具,利用这些技术来改进自己在现有市场中的表现,以更低的成本提供更好的用户体验和价值。

例如,为全球用户提供语言学习服务的 Duolingo 上线了两个基于 GPT-4 的新功能 Roleplay 和 Explain My Answer。依靠这样的创新,Duolingo 有望进一步提升收入。

再比如,软件企业 Intercom 在今年年初推出了基于大模型技术的智能客服机器人产品 Fin,允许客户将私有数据和知识导入系统,进一步强化自己的产品价值。 尽管引入了 AI 技术,这两家企业的核心客户价值没有改变,所处的价值网络也没有发生变化,是典型的「延续性创新」。

除此之外,改进现有产品的交互方式,让用户能够通过自然语言界面完成事务性任务,对于许多软件,尤其是复杂的企业软件来说,可以有效提升功能的使用率和用户体验。例如,很多人会有在 Excel 里将“值小于 0 的 cell 高亮标记“ 这样的需求,但是知道怎么操作的人不多。有了自然语言界面后,能顺利使用这类功能的用户就变多了。

交互可以从对话开始,却不一定非要以对话结束。通过合理的设计,让用户能够享受自然语言输入指令的便捷,同时产品也能以最合适的形式回应用户,是产品创新的关键。

对于新兴企业,试图借助简单地套壳 OpenAI 来颠覆成熟企业和行业是不现实的。相反,它们应该更关注「颠覆性创新」,通过把相对成熟的技术包装起来,不断试错和迭代,找到合适的产品形态、愿为之付费的客户和可以盈利的商业模式。这些新产品需要在市场中找到立足之地,与成熟产品在不同维度上竞争。

举例来说,Midjourney 以强大且极具风格化的「文生图」能力吸引了一千四百万用户,创造出约3亿美元的年收入,展示了颠覆性创新的潜力。同样,Character.ai 允许用户定制聊天机器人,吸引了400万月活跃用户,估值高达10亿美金。尽管这些新兴企业的商业前景仍需观察,但这种由产品驱动的创新将会越来越多。

在专业领域,如财务、健康、法律等,大语言模型结合自然语言界面也具有巨大潜力。一方面它能提高专业人士的服务质量和效率;另一方面也可以让用户以自助的方式获得所需信息。例如,房贷怎么还更合理、遗产继承顺序是什么样的、二手车如何过户等问题,直接问系统就可以了。

更抽象的看,用户获取信息的方式会从搜索过渡到下一个阶段。我相信未来会出现整合所有多媒体信息的超级数据库,一个超级大脑,人们可以随时随地用自然语言查询任何信息。Perplexity 在这方面做了许多工作,这也是我们自己的项目 Grape Search 的愿景。

在消费互联网之外,也有许多行业亟待 AI 赋能,例如物流、制造、自动驾驶、医疗等。这些行业的用户规模没有消费互联网大,企业往往不愿投资自建专业的 AI 团队。随着大模型的能力使得开发专属 AI 模型的成本降低,组建公司来支持 AI 技术在特定行业的落地也在商业上变得可行。


注:延续性创新、颠覆性创新、成熟企业、新兴企业的定义可参考《创新者的窘境》一书。

参考资料:

  1. AI-powered UI.
  2. Opportunities in AI by Andrew Ng.
  3. Product-led AI by Seth Rosenberg.
  4. Midjourney statistics.
2023-10-07

利用 GUI 完成某些任务时常常需要多次点击,既不容易学,也不容易记。如果用户可以用语言控制软件,那么更多的功能就可以被更多的用户所使用。

系统给用户的反馈不一定是会话式的,一个聊天气泡所具有的展示能力远不如一个表格或图表强大,因此在用户侧我们更看重“命令输入的简便性”,在系统侧更看重“以何种形式给用户回馈最为高效和直观”。

类似“合理的信息架构”这样对于可用性很重要的课题,在会话式 UI 的前提下就没那么重要了。而 Make the easy things easy, and the hard things possible 这样的指导原则也变得不重要,因为我们现在可以让所有事情都变得 easy。

软件用户界面将从一个“精心设计的建筑物”变成“哆啦A梦的口袋” — 只需许下愿望,系统就将所愿之物呈现于眼前

2023-09-29

瓦依那在乐夏第三季表演完《大梦》之后,收获了观众热烈的掌声和感动的泪水。

十八说了一段关于“语言的破坏力”的话,颇有哲学意味。

我觉得语言它具有破坏的能力,就是你一旦一个东西一说出口,它就破坏了。
比如说我说我要沉默,我一说出口沉默就没了。
我说我要享受当下,然后我一说出来我享受当下,当下就溜走了。
我觉得语言真的是…… 留给歌词吧。

2023-05-26

再谈 ChatGPT

距离上一篇文章《ChatGPT意味着什么》仅过去了三个月,大模型和AI领域的迅速变化已令人应接不暇,有些趋势日渐清晰了。

大模型之争

GPT-4 有了更强大的推理能力和数据处理能力,并支持插件系统,初现生态端倪。

Anthropic 发布 Claude, 将 context window 提升到 10k token.

Google 发布 PaLM 2 和 Bard 升级,集成 Google Suite。

微软的 Microsoft 365 Copilot 将大模型带进企业办公场景,Windows Copilot 将大模型带进主流电脑操作系统。ChatGPT iOS app 将大模型带进智能手机。

5月23日召开的微软 Build 大会中反复提到的两个概念是 copilotplugin。这两个概念下面我们再详细展开。

大模型厂商同时打造 2C 的聊天产品是一个必然,一来需要展示自己大模型的能力,必须亲自掌控用户和产品的交互;二来需要收集用户反馈以改善自己的大模型;三来可以获取用户流量,2C产品的用户基数越广泛,将来自己的大模型胜出的几率就越高。

大模型厂商的格局大致如下:

language models

微软没有自己的大模型,它凭借是 OpenAI 的股东,充分利用了 GPT-4 的能力。

Meta 没有 C 端产品,其开源的大模型 LLaMA 更多是被开发者用作 GPT-4 / ChatGPT 的平替。

国内的百度、阿里以及一些创业团队也先后推出了大模型,但是其可用性和性能方面的公开数据还比较少。

交互范式

这波浪潮带来了一个宏观和一个微观的交互范式革新。

Copilot 这个概念是宏观层面的交互范式革新。它本质上是一个记忆力好、聪明、执行力强的「助理」,在数字世界里几乎无所不能。但是,「有事找助理」这种思维方式对大多数人来说都是新的。

举个例子,Windows 操作系统功能强大且复杂,很多用户仅能用到约20%的功能。在没有「助理」之前,用户要想实现目标,必须首先知道「这是可以实现的」,接着上网搜索或在论坛提问,学习「如何实现」,最后亲手操作诸多菜单和按钮来实现。有了「助理」之后,用户只需要提出自己的目标,而且是用自然语言的形式,「助理」就知道行不行、如何做,甚至直接替用户完成操作。

可想而知,Copilot 在许多场景下都能极大提高生产效率,但是这种宏观交互范式的改变需要时间去适应。聊天式交互在操作系统层面的集成,对培养「有事找助理」的思维方式将有很大的促进作用。

聊天式交互则是微观层面的交互范式革新。聊天式交互在大模型出现前就存在了,但是应用并不广泛,最大的制约因素在于「机器人不够聪明」,它们很多时候不能理解人类意图。大模型的出现改变了这一点。大模型非常聪明,能满足甚至超出人类的预期。它的特长是理解自然语言和回复自然语言,这使得大语言模型和聊天式交互几乎是强绑定的。

向聊天式交互的转变会更容易一些。人类对聊天式交互早已习以为常,每天都在和朋友、亲人通过 IM 聊天,跟一个 copilot 聊天也没什么不同。尽管目前有很多写 prompt 的技巧可以对大模型进行「调教」,但我相信随着大模型的成长,会不会写 prompt 对结果的影响不大。

双向集成

制约「助理」能力的诸多因素中,以下两个最为重要: 大模型使用静态数据训练,无法访问实时信息 能做的事局限在「知识领域」和「数字世界」,无法直接和物理世界产生联系

插件 (plugin) 这个概念就是用来增强「助理」能力的。各行各业的软件和互联网企业通过开发插件把自己的服务和「助理」相连,让用户可以通过「助理」来使用服务。这些服务有的擅长访问实时信息(如搜索引擎),有的擅长计算(如 wolfram alpha ),有的擅长和物理世界发生联系(比如电商、出行、旅行等服务),是对大模型能力的完美补充。

大模型厂商通过不断推广自己的 C 端产品,让更多的服务提供商注意到这个新的用户聚集地,并将自己的服务能力「嫁接」给大模型。这与 iOS 和 Android 打造开发者生态的逻辑相同。目前看来这个逻辑很成功,ChatGPT 上线不到一周就吸引了一百万活跃用户,此后也保持了高速增长。而更多的用户也吸引了更多开发者和更多研发投入。

cycle

这是从大模型厂商视角来思考的,我们姑且把这种集成模式称作「正向集成」,它解决的问题是「如何让更多的能力为大模型所用」。

用户都在向 ChatGPT 聚集,把自己的服务「嫁接」过去似乎势在必行,就像当年从 web 转向 mobile,后来又出现小程序一样,用户在哪里,店就开到哪里。用户的聚集行为,不仅仅是存量用户的迁移(比如搜索用户转到 ChatGPT 来),也会带来一些增量,比如原来对科技不怎么熟悉的用户也会学着通过聊天式交互去使用数字服务。

从开发者角度看,还可以进行「反向集成」,尝试「让大模型的能力为“我”所用」。这里的“我”可以是初创团队,也可以是已经具备行业地位的企业。例如,我是携程,当用户越来越习惯聊天式交互后,我要不要在自己的平台上提供「聊天订机票」的服务?想要提供,就要将大模型的能力集成到系统里。

但反向集成的必要性存在一定挑战 — 在现有产品中集成聊天式交互不一定能成为企业的竞争优势,反而可能造成「点按式交互」和「聊天式交互」的左右互搏,让用户迷惑。

user confusion

从 OpenAI 网站上看到的大部分成功案例,其企业原本就是提供内容类服务的,甚至交互形式就是聊天式的(比如教育类产品),因此 AI 可以有效提高内容生产效率和智能化程度。而非知识型的产品或服务,尤其是和物理世界联系紧密的,比如出行、电商、零售、地产、银行等行业则暂时没有很好的集成案例。

办公应用

已经被验证了的一类「反向集成」场景是办公应用。

大模型的能力加上企业自身的数据,可以形成企业内部的「超级大脑」和「生产效率神器」— Microsoft 365 Copilot 和 Google Bard + Suite 就是很好的例证。而 Windows Copilot 的出现则更进一步,为个人用户定制了属于自己的「超级大脑」和「生产效率神器」。

无论对个人还是企业来说,这类场景的价值显而易见,但亟待解决的问题是如何保护企业或个人隐私。

虽然微软声称不会使用企业内部数据来训练大模型,但是这种怀疑目前还无法彻底消除。5月,苹果公司因担忧数据泄露,禁止员工使用 ChatGPT 和 Github Copilot 等外部 AI 工具,稍早之前三星、JP摩根、Verzion、Amazon 等公司也采取了类似举措。

结语

大模型技术进步神速,对它的应用还远没有发展的那么快。虽然早有「各行各业都要重做一遍」的说法,但目前行业内并没有掀起这样的热潮。如何利用大模型创造价值,大家都在深入思考和探索。

此外,大模型和AI技术还面临着监管缺失。2023年5月16日,OpenAI 的 CEO Sam Altman 出席美国国会的听证会,接受立法者的质询。Sam 呼吁政府立法加强监管、实施许可证制度、制定安全标准并由第三方专家独立审核 AI 产品的各方面指标。如何设立规则和边界,让这项技术朝着更有利于人类进步的方向发展,政府也在努力思考和探索。

Last but not least, 期待中国的大模型早日赶上。

2023-03-30

追求质量的代价

如果你在大厂做过设计师,你肯定对自家产品的质量不甚满意。我待过几家大公司,在追求质量方面,每家公司都有值得吐槽的地方。作为设计师,我时常感到在团队里普及质量意识不容易,人们更喜欢盯着业务指标,不能提升业务指标的事情,大家就提不起干劲来。

最近读到一篇文章,完美写出了我在这方面的思考。文章作者 George Kendenburg III (GK3) 曾先后在 Facebook 和 Instagram 做过八年的设计师,他先是因为在 Facebook 工作感到郁闷转岗到了 Instagram,随着 Instagram 规模扩大,他再次感受到了同样的郁闷。他目前已经离职,加入了一家创业公司。

这篇文章的标题叫 The Cost of Craft。Craft 这个词意为工艺、手艺,在科技公司里,一般指在设计和开发软件产品时,对于代码、设计、用户体验、细节等方面的极致追求。

以下是我对文章主要内容的翻译,但是直接说工艺、手艺不好理解,所以我用“质量”这个词来代替 craft。


源起

2018年初,我产生了转岗到 Instagram 的想法。我约当时 Instagram 设计团队的负责人 Ian Spalter 一起吃午饭,他慷慨地答应了。席间他始终在问我一个关键问题:“你为什么想来 Instagram?”

答案是:我想亲身体验 Instagram 是怎么能持续在这么高的质量水平上做执行的。

那时我在 Facebook Video 团队已经工作了三年,心力交瘁。我对“快速试错”和不停“测试”一些不完整的产品感到厌倦。经过几轮可疑的数据验证之后,其他职能的人就开始推着设计团队妥协。最终,我们会上线一个缺少灵魂的、扭曲的产品,这个产品和最初的想法相比早已面目全非,但它在提升业务指标方面的效果倒是不错。

相比起来,Instagram 简直像一个乌托邦。那里的人都很重视细节!Bug 都第一时间得到修复。项目组讨论问题的时候,设计好坏也是一个影响决策的因素,直觉和常识比指标更重要!每次上线,他们都把质量水平提得更高。每个动效都恰到好处,不会莫名出故障或者有奇怪的转场效果,每个交互细节都经过了深思熟虑和完美执行。

我当时特别好奇,Instagram 团队有什么秘诀呢?

跟 Ian 吃完那顿午饭后又过了六个月,我终于有机会加入 Instagram 了。一开始,一切都跟我想象的一样好,我和一群牛人一起做很牛的项目。我学到了简洁、聚焦、克制的重要性,抛弃了一些坏习惯。跟我合作的工程师也很关心细节,他们实现出来的产品跟我设计的原型几乎分毫不差。

随着 Instagram 的成长壮大,产品功能越来越复杂,公司员工越来越多,竞争对手也越来越多。三年过去了,我觉得这里的工作环境开始变得像 Facebook 了 — 对于业务指标的追求超越了对打造人们喜爱的产品的渴望。

似乎所有的数字产品都难逃“追求规模高于追求质量”的宿命。

是什么因素腐蚀了原来的文化呢?思考了很久之后,我认为最终可以归结到一个原因:

追求质量的代价随着团队人数增长而升高。 这里的“人数”指个人贡献者 — 产品经理、设计师、工程师。

我苦苦追寻的秘诀其实就是恰到好处的团队规模优秀人才的结合。当时 Facebook 有几百名设计师和几千名工程师,有很多条业务线。Instagram 团队的规模小得多,所有人都在做同一项业务。很显然,让十个人保持同步比让一万人保持同步简单得多,每增加一个人,沟通和聚焦的成本就升高一些。难怪 Instagram 的执行的水准那么高!

小团队的好处

团队小的时候,做什么都不费力。但如果你认为这是“公司的DNA”,你就错了。小团队有许多天然的好处是很容易被忽视的。

  • 聚焦:小团队资源少,不得不聚焦,这让团队更懂得“简单”的重要性。为了节省大家的时间,设计和开发组件时也会更注重通用性。
  • 高质量的招聘:小团队的HC少,因此会格外珍惜每一个招聘新人的机会。反之,如果像 Facebook 那样每年要招很多人,对候选人的要求有时候就降低了。
  • 责任感:因为聚焦和高质量的招聘,每个团队成员都很在意产品的好坏,他们发自内心的关心产品,发现问题时也会及时指出来。

随着团队规模扩大,这些好处都会慢慢消失。如果不重视培养质量意识,复杂性张力很快就会取代小团队的种种优点。

复杂性

让产品保持简单是件很困难的事,尤其是当你的产品有大量用户时,用户会提很多要求。为了满足他们,产品的功能不可避免地越来越多。市场上也会出现越来越多的竞争对手,每个竞争对手都把你向其他方向拉扯一下,如果你跟随它们的脚步,产品很快就会变得臃肿不堪。

与此同时,随着团队规模扩大,创始人不可能有精力参与每一个产品决策,业务团队终归要自己决定一些事情。这时候就需要一个抽象的代理 abstraction layer 来指导每个团队,确保它们的方向正确。

在 Facebook,这个抽象的代理是业务数据指标 data and metrics. 管理层根据公司的核心业务目标制定自己业务线的业务指标和目标,如果上线的某个产品功能提升了这个指标,我们就认为产品变得更好了!个人提升指标的能力被称为这个人的“影响力 impact”,影响力直接与个人绩效和奖金、晋升挂钩。这种激励机制让每个人都想在“提升指标”这件事上做得更好,但实际上我们都知道,指标提升不等于产品变得更好。

提升业务指标的手段一般是改造产品,改造大体上分三类:创新、迭代和补全。

创新

一般来说指一些大的变化。对产品的某个模块进行重新设计,或者开发一款新产品都属于创新类工作。这类工作意味着大量的探索、实验、不确定性和跨团队的协调。在大公司里,这种协调往往都比较难。即便最后能成功上线,你会发现用户还需要一段时间去适应新事物,短期内业务指标不那么好看,甚至有下降的可能。这种项目在公司早期比较常见,但是在成熟期就显得“风险太高”了。

迭代

相比创新类项目,这类项目的范围比较小,通常是对现有功能的渐进式改进。这类项目好执行,造成指标下降的风险也比较小,但也不会带来太大的增长。

补全

这类项目通常指的从竞争对手那里借鉴功能。竞争对手已经证明了用户需要这些功能,因此人们通常认为这些功能“风险低”甚至“是必要的”。它们对业务指标的短期影响通常也都不错,一部分原因是由于新鲜感,用户的使用确实变多了,另一部分原因是管理层为了项目成功在产品里进行的推广— 新增一个 tab 或者显眼的 banner。

当然只做哪一种项目都会让产品变得扭曲,健康的产品需要精心平衡这三类项目。小团队可以轻松地实现平衡,但在大公司里,当人们的绩效评估和业务指标紧紧挂钩时,平衡就没那么容易了。与其想着怎么让产品更好,不如想着怎么能更好地提升业务指标。从这个角度看,补全类项目脱颖而出,成了通往成功的捷径。

补全类功能通常意味着在产品里开辟一块新领地,因为要想优雅地把新功能融入现有产品中去太耗时耗力。那用户怎么知道这块新领地呢?理想情况下,你可以说服某个团队在主导航区域新增一个 tab,如果太难,你也能接受在一个流量大的页面上增加一个显眼的入口。有了入口,你就可以打造自己的功能了。打造自己功能的好处是,你可以制定自己的规则,使用自己的 pattern,不用获得其他团队的批准(可以节省大量时间!)。你还可以不遵守整体的设计规范,因为你的功能是“如此特殊”,别担心,你的总监或VP会尽其所能帮助你上线这个新功能。上线后,总监或VP会要求“破例进行一次推广”来确保“足够多的用户看到它”。所有这些因素叠加起来,新功能很难不提升指标。接着,就会有下一次。

当天平向补全类项目倾斜,人们很容易失去大局观,产品愿景慢慢被“追求用户数量”和“补全更多功能”的惯性取代。产品变得庞杂臃肿时,你不禁感叹,这些功能到底是谁要求做的?团队里的一群聪明人用看数字代替了思考和判断。

这样的变化不会一夜之间发生。最开始,可能只是放过了一两个不那么靠谱的需求和几个“临时的修复”。然后你发现,团队开始走捷径,确保在六个月的绩效评估期内能产生足够的“影响力”。技术债越积越多,人们永远都没时间去收拾之前的烂摊子。复杂性开始叠加,带来了不健康的张力 tension。

张力

当你的愿景变成“做更多的功能”,你会发现竞争对手也多了起来。它们做的事情可能和你现在的业务有联系,也可能不相关。每个竞争对手都意味着要成立新团队,制定新目标,还有从管理层下达的“不惜一切代价战胜对手”的新指令。

在 Instagram 早期,团队很重视简单这个价值,表现之一就是尽量避免创建新页面。因为每次创建一个新页面,用户的对产品的 mental model 就要跟着扩展,并且这些新页面需要新入口。产品功能少的时候,入口不难加,毕竟还有很多空间可以利用。但随着产品功能越来越多,团队对于界面空间的竞争就会越来越激烈。一级页面成了必争之地,占据一级页面上的位置就意味着你的新功能可以有更多曝光。

然而页面上的空间总是有限的,如果没有共同的愿景统领团队,很快它们之间就会打得头破血流。你可能经常听到人们这么说:

  • “如果我们不依赖那个团队的项目,我们能开发得更快,这个组件我们可以开发自己的版本”
  • “我觉得他们那个项目肯定没戏,我们不能把自己的项目跟它挂钩”
  • “开发一个通用的组件是浪费时间,考虑其他可能用到的场景对我们的目标没有任何好处”
  • “尽管这样开发可能对另一个团队更好,但是咱们还是应该首先为自己的目标服务”
  • “咱们发布之后,其他团队可以学习怎么使用咱们开发的组件”

这种思维方式直接带来质量的降低和功能的无序叠加。因为没有考虑灵活性和复用性,组件更容易出问题。所有东西都成了 one-off,技术债没有机会还。设计一致性变差。团队什么都要自己做,压力变大,更没有时间关注质量。

要缓解这种张力,需要把大家的目标统一到共同的愿景上来,而不只是“获取更多用户”这样的目标。但不幸的是,如果你的组织长时间这样奔跑,它几乎不可能停下来。

想出一个共同愿景很难,因此管理层有时候会通过调整组织结构和项目分配来暂时缓解问题。但这不是长久之计,如果不改变激励机制,复杂性和张力迟早还会回来。

如何改变

团队规模变大时,追求质量的代价变高,但是投入更多资源到基础设施层面,保证产品各方面的一致性也是必要的。

给个人贡献者的建议

  • 定义价值观:召集尽可能多的同事,讨论在产品决策时应遵循的原则,达成一致后把它写下来。书面文档在拒绝不靠谱的想法时会很有帮助。尽可能得到更高级领导的支持,比如你的总监或VP。
  • 持续宣扬愿景:设计师的特殊能力是可以将愿景可视化。抽出一部分时间来做些大胆的尝试,用来提醒人们未来的各种可能性。
  • 与合作者建立良好的关系:花时间了解其他角色的诉求。与他们建立良好的信任关系后,拒绝不靠谱的想法就没那么难了,因为你们毕竟还会在靠谱的想法上继续合作。

给管理者的建议

  • 不断优化愿景:如果感到当下的工作只是在机械地做增长,那么是时候设想一个新的愿景了。
  • 修复激励机制:引入和质量或大局观有关的评判标准来部分抵消只看数据带来的负面影响。在绩效评估时,除了关注那些可量化的业务指标,还可以问问“这个迭代你怎么帮助了其他团队”或者“你贡献或者改进了多少公用组件”。
  • 关注基础设施:经常性地留出一些时间不开发新功能,只改善基础设施。成立基础设施团队,保证这个团队的规模随着业务增长而增长。
  • 建立“本地”设计系统团队:在业务团队内部建立相应的设计系统团队。这个团队专门负责与其他业务线协作,并与公司大的设计系统团队配合,一方面帮助改进现有设计系统,另一方面支持公司设计规范在本业务线的落地。

GK3 对于这个问题的观察很到位,提出的建议也非常有操作性。我相信如果团队能共启愿景、统一质量意识和标准、主动承担责任,我们就有可能在大团队里打造出高质量的产品。

2023-02-12

ChatGPT 意味着什么

这段时间网络热议的话题能和《狂飙》拼一拼的,就非 ChatGPT 莫属了。这位无所不能的 AI 机器人在全球掀起了一场狂潮。未来的历史不管是由人类还是由 AI 书写,大概都会认为这是个历史性的时刻。

先不说 ChatGPT 能力如何,光是微软和 Google 在这个领域的争夺就赚够了眼球。

微软 vs. Google

ChatGPT 发布于 2022 年 11 月,迅速引发热议,网友纷纷晒出自己和它的对话,并感叹它有多么神奇。

次年1月,微软决定向 ChatGPT 背后的公司 OpenAI 再投资 100 亿美金。微软获取 OpenAI 利润的 75% 直到收回投资,此后仍持有 OpenAI 49% 的股份。之所以说“再投资”,是因为之前已经投过一次了,这个我们后面再说。

看到这股热潮以及微软在这个领域的频繁动作,Google 坐不住了。

2023年2月5日,Google 向 Anthropic 投资 30 亿美金,占其约 10% 的股份。Anthropic 是一家和 OpenAI 类似的从事人工智能研究的公司。实际上,Anthropic 的创始团队就是从 OpenAI 出走的。这家公司曾在 2023 年 1 月推出了类似 ChatGPT 的产品 Claude,但没有受到什么关注。Google 的这项投资被看作是对微软投资 OpenAI 的回应。

Claude 激起的水花和 ChatGPT 明显不在一个量级上。因此 Google 光投资还不够,还要拿出真本事才行。

2月6日,Google 发布了 Google Bard,被认为是 ChatGPT 的有力竞争对手。在发布 Bard 的博文中,Google CEO Sundar Pichai 还不忘提及 GPT 中的 T (Transformer) 是本公司在 2017 年发明出来的,这话听起来酸溜溜的。

Bard 意为“吟游诗人”,尽管这个名字比 ChatGPT 更浪漫,但听着一点都不 AI。

出自 Google Bard 演示视频 ▲ 出自 Google Bard 演示视频

微软已然占了先机,当然不能被别人盖过风头。

2月7日,微软召开了一场针对媒体的说明会,活动现场发布了集成 ChatGPT 的 Bing 和 Edge 浏览器。

Bing ▲ 出自 Bing 演示视频

微软 CEO Satya Nadella 表示,AI 的发展将在软件领域掀起巨大革命,而首先要触及的领域就是搜索。“在 AI 的帮助下,用户可以从搜索和互联网中获得更多价值”。

轮到 Google 出牌时,Bard 却打了脸。

2月9日,网友发现 Google Bard 在回答一个和韦伯太空望远镜有关的问题时给出了错误的事实(对,就是上面那张 Bard 截图里的内容)。这个消息一出,Google 母公司 Alphabet 股价大跌,市值迅速蒸发了 1000 亿美金。

更有趣的是,媒体的报道口径产生了微妙的变化。

News

Paul Graham 如此评价:“这就是你不早点发布产品的下场,你的产品总会被人拿来与那些更早发布的产品做比较。(报道里)这个修饰 Bard 的从句对于微软来说比任何新闻都受用。”

要知道 Bing 干了这么多年,在搜索市场占的份额还没超过 3%,就这也已经是排行老二了。在搜索领域从来没正眼瞧过别人的 Google 现在被人拿来与 Bing 做比较,真是伤害性不大但侮辱性极强。

让我们假设 Bing 能最终取得对 Google 的胜利,这场胜利一定不会是以 Bing 一路蚕食 Google 的搜索市场份额为代表的,而是 Bing 创造出一种全新的从互联网上获取信息的方式,以及与之配套的行业生态。

看热闹归看热闹,考虑到训练大语言模型需要的技术、数据、资金、算力、时间等资源,除这两家之外,也许没有其他玩家有实力进场了。

唯一的变量是中国。因为各种非技术因素,我国显然不会基于 OpenAI 或 Google 的模型进行应用开发。未来中国也许会出现类似的 AI 技术基础设施,我们拭目以待。

不管玩家间争斗结果如何,这个新技术时代的大门,已然开启。

AIGC (AI Generated Content, AI 生成内容)

见识过 ChatGPT 的能力后,网友感叹:还有什么是 AI 不能做的?

ChatGPT 是一个 text to text 模型,尽管其底层的模型非常复杂,训练数据量十分巨大,但简单的说,这个模型的工作原理是:输入一段文字,输出一段文字作为回应。

AI 模型除了能输出文字,还能输出别的吗?答案是肯定的。

以 OpenAI API 为例,它提供三个 AI 模型供开发者使用:

  • GPT-3:自然语言 → 自然语言
  • Codex:自然语言 → 程序设计代码
  • DALL·E:自然语言 → 图像

代码:Copilot

Copilot ▲ 出自 Github Copilot 官网

早在2021年10月,Github 便在 JetBrains 市场上以 IDE 插件形式发布了 Copilot. Github 将 Copilot 定义为”你的AI编程助手”,它可以实时地在编辑器里生成语句和完整函数代码。

Copilot 基于 OpenAI Codex 打造,是微软投资 OpenAI 十亿美金结出的第一个成果。这个十亿美金,就是我们前文提到的微软对 OpenAI 的第一次投资。

2022年3月,Copilot 在 Visual Studio 上发布,目前已集成到各大主流 IDE 中,包括 Visual Studio, NeoVim, VS Code, JetBrains IDE 等,已经成为一个商业产品。

图像:DALL·E 2 和 Stable Diffusion 2.0

AI 生成图像在 ChatGPT 流行起来之前就已经引发不少关注了,但相比聊天,有心思用 AI 搞“艺术创作”的人本来就少,而且能找到合适的文字提示让 AI 画出赏心悦目的画也有一定门槛,因此它没能像 ChatGPT 这样成为全球大流行现象。

这个领域的主要产品是来自 OpenAI 的 DALL·E 2 和来自 stability.ai 的 Stable Diffusion 2.0. 两者发布时间差不多,前者是2022年7月,后者是2022年11月。他们的使用方法几乎一样,连商业化的方式也类似。

Horse by DALLE ▲ DALL·E 2 生成的图片

stability.ai 这家公司2020年在英国伦敦成立,2022年10月获得了约一亿美金投资,公司估值约为十亿美金。它的主要产品就是开源的模型 Stable Diffusion 2.0 和基于它进行图形绘制的工具软件 DreamStudio。

Image by SD ▲ Stable Diffusion 2.0 生成的图片

音乐:MusicLM

2023年1月,Google 发表了一篇名为 MusicLM: Generating Music From Text 的论文,声称已经攻克了从文字生成高品质音乐的 AI 模型,同时在 Github 上发布了一些示例。

这个消息也没有引起 ChatGPT 那样的波澜。我想一方面是因为它还没有公开可用的产品,另一方面,对音乐感兴趣的人也远没有对聊天感兴趣的人多。

下面这段音乐,就是根据如下文字描述生成的:

The main soundtrack of an arcade game. It is fast-paced and upbeat, with a catchy electric guitar riff. The music is repetitive and easy to remember, but with unexpected sounds, like cymbal crashes or drum rolls.

https://general-1258275882.cos.ap-chengdu.myqcloud.com/chatgpt/audio.mp3

除此之外,还有一些公司在垂直领域打造 AIGC 的产品。例如,Galileo.ai 号称借助 GPT-3 的能力实现了从文字描述生成 UI 设计。从它的演示视频来看,似乎并不比直接在 Mobbin 或者 Pinterest 上搜索图片进行参考来得更方便。但是,如果它生成的设计文档真能直接用 Figma 编辑,还是会极大提高设计师的生产力。

我会被 AI 取代吗

前几天有新闻报道 ChatGPT 通过了 Google 公司三级工程师的编程面试,这一级别工程师在 Google 可以拿到 18.3 万美金年薪。

网友不停测试 ChatGPT,发现它什么都能答上来,写个文章、拟个合同、作诗、写对联都不在话下,许多人开始担心自己将被 AI 取代。

人类历史上每次技术革命都会消灭一些工作岗位,但是人类并没有就此躺平,而是利用新技术创造出新的工作岗位,把人类文明提升到更高的高度 – “君子生非异也,善假于物也”。

ChatGPT 也一定会消灭一些岗位,但人类也会想出办法更好地利用这些工具。未来的我们不论从事什么行业,都能以 AI 生成的内容作为草稿,谁说这不是对生产力的解放呢?

目前的 AI 模型在能力上还有许多不足,训练成本过于高昂,在道德、法律方面还需要更多的监管,但是它向前的步伐已经不会停下了,它会催生一个新的技术时代。

思考这个问题有两个视角:技术从业者和普通人。

技术从业者想的是“技术革命”,是构建新时代的样貌,预测并推动行业变迁,并从中占据一席之地。

上文提到的 Galileo.ai 这样的公司,未来会大量涌现,把 ChatGPT 相关的技术与各个行业进行交叉和创新。事实上,从 OpenAI API 网站上的例子来看,已经有上千家公司借助 GPT-3 的能力开发出自己的产品了。这些产品能够帮人更好的学习语言、报税、分析客户反馈等。

这些创新自然会消灭掉一些行业,也会催生出新的行业,一如当年互联网和移动互联网所做的那样。

王建硕说:“有和没有,是质变;而质变,会引发与之相关的产业的产生,而这个产业已经和它本身没啥关系了。解释一下:浏览器的诞生之日,几乎就是互联网产业诞生之日;而互联网产业,绝不是浏览器产业;ChatGPT 的大模型诞生之日,就是基于自然语言的人机交互时代的诞生,而这个时代绝不是大语言模型时代。催生了一个时代的技术,不见得是这个时代最重要的技术。”

对于普通人(比如记者、律师等),努力跟上潮流,关注技术的发展,思考新技术对于自己行业的影响,找到未来图景里 AI 无法替代的价值,学习那些技能,或者转行。

Idea

以上思考的出发点是把 AI 和机器智能当作是为我所用的工具,目标是推动人类社会进步。但是,这是机器想要的吗?如果有一天,“机器智能弱于人类智能”这个大前提崩塌,又会怎么样?

鲍捷认为人类社会终将被机器智能取代,他在《脱碳入硅》里说:“人类担心工作职位被机器取代是自大的。实际上,机器将消灭社会的需求,而不是满足这些需求本身。正如机器已经帮助我们基本消灭了对狩猎和萨满的需求,未来也将消灭对律师和教师的需求。因为我们并不重要。”

人类智能 vs. 机器智能

人类该如何与机器共存的问题,已经在许多文学影视作品中被一再探讨了。经典如《黑客帝国》向我们描述了一种可能 — 人类无法正确处理与机器的关系,也无法克服人性的弱点,造成了“被机器豢养”的结果。理性来看,这当然不是我们想要的局面,但是在机器制造出来的“真实的欢愉“面前,又有多少人能抵挡诱惑。实际上,AI 根本不会为人类创造 Matrix 保留个体意识,这太不划算了。

我们目前面临的是机器在微观层面上对人类的超越 — 从拥有的知识量来看,ChatGPT 可能已经超过了所有人。然而这种个体层面的比较并没有太大意义,机器智能的优势是群体性和社会性的。机器智能对人类社会的全面接管,才是不可逆转的大势。

《脱碳入硅》里提到:“关于人类被机器取代,我们要明确不是‘人’被机器人取代,而是‘人类社会’被‘社会机器’取代。人可能依然有一部分存在,但是是作为社会机器的线粒体,用文化上已经是服从机器进化的需要,而不是人本身繁衍的需要。从文化的意义上,人类这时候已经亡了…… 我们的意识是无足轻重的,意识只是进化长河里偶尔出现的小浪花。”

电影《银翼杀手》里被猎杀的对象是内里机器外表人形的复制人,这依然是人类根据自己的形象构建的假想敌。罗伊·贝蒂死前对着追捕他的银翼杀手德卡德说出的那段经典台词,像极了机器送给人类的挽歌:

我见过的光景,你们人类绝对无法想象。
攻击舰在猎户座的边沿熊熊燃烧,
我曾见 C 射束,
在唐怀瑟之门近旁的黑暗中灿灿生辉。
所有这些瞬间都会在时光长河中湮没,
如同……雨中的……泪水。
死时已到。

人类文明终会延续,但也许是以一种我们意想不到的形式。

参考资料

  1. Google is investing $300M in an OpenAI challenger that will take on ChatGPT while focusing on A.I. safety.
  2. An important next step on our AI journey.
  3. Reinventing search with a new AI-powered Microsoft Bing and Edge, your copilot for the web.
  4. Google shares drop $100 billion after its new AI chatbot makes a mistake.
  5. MusicLM: Generating Music From Text.
  6. MusicLM examples.
  7. ChatGPT Passes Google Coding Interview for Level 3 Engineer With $183K Salary.
  8. ChatGPT 开启了一个时代,但与之竞争已成为局部战争。
  9. 脱碳入硅。
2022-10-07

实体书店

下午天气晴好,心血来潮想去趟中关村图书大厦。上次去应该是好几年前了,这些年的书基本上都是网购,再加上疫情,很少有逛书店的想法了。

电商和电子阅读对实体书店的冲击毋庸置疑,所以我这次是想体会一下像中关村图书大厦这样曾经辉煌的实体书店究竟会“落魄”到什么程度。

我还没进门,就看到一对父子拎着一叠书从门口走出来。他们边走边聊,脸上洋溢着快乐的笑容。

进门逛了逛发现,情况比我预想得好多了。这让原本预期是看到一派萧瑟的我感到安心。

一楼原来是音像区,面积较小,大部分人都会直接上二楼。我也照例上了二楼,一上去便看到习大大的书摆在正对电梯最显眼的位置。

适逢二十大前夕,各处都在喜迎大会,书店也不例外。这与过去几年的宣传舆论导向一脉相承,宏大叙事,民族自信。

书店的布局变了。

原来我常去的以计算机和小说类书籍为主的四层关了,上行扶梯口用几个高书架挡着。

那些书籍被搬到了三层,区域变小了,猜测应是为了缩小规模、节约成本。

新开辟了一个国学区,用两个半圆形的书架围起一块圆形的区域,古色古香,也符合我们的宏大叙事。我没有走进去看。

让我感触最深的是,这里新增了很多书之外的服务,比如一个卖电子产品的区域,上面贴着大大的 HUAWEI 标识,里面经营各种智能手机和平板电脑,主打的应用都是教育类的,也有家长带着孩子在体验。

我还看到了一个互动区,一位老师在前面讲,旁边是一个大的液晶电视,上面展示着古诗词,旁边易拉宝上写有“喜迎二十大,中国好少年”,这是个和古诗词相关的活动。面向电视摆了十几把桌椅,有很多小学生坐在那里积极参与活动,很热闹。

书架的空隙里摆上造型简约的木桌子和带靠背的椅子,供人休息、读书使用。这比以前人性化了很多。我记得以前很多人坐在地上、窗台上读书,现在虽然也还有这样的人,但大部分人都可以坐着相对舒服的椅子读书了。

靠里一点还有一个咖啡厅,顾客可以点一杯咖啡或奶茶,边喝边读书。尽管面积不大,但在书店里开辟这样一块地方已实属不易了。里面坐满了人,大家都在安静地看书。

我给女儿买了两本教辅和一本英文原版的《阿拉丁》。售货员还是用熟练的手法把书整理在一起,然后用一段绳子把它捆扎好,方便人拎着。这部分是熟悉的,是给这实体书店增添了人文色彩的温暖举动。

我希望这样的服务多一些,但又隐隐担心售货员的这些工作最终会被冰冷的机器取代。

走出书店,门外的阳光已经变成了橘色,秋天的味道无比浓郁。

我有些感动和欣喜。像新华书店这样的老牌企业,也能做到旧中有新,努力融合新事物,从单一功能变成综合性服务空间。而且亲眼看到传统书店仍然有人气,这让人充满希望。

突然想起最近读到的一个观点,现代人在现代社会里充满了焦虑、迷茫、压力,这些现代性带来的弊端,需要我们从前现代社会里找寻那些抚慰人心的元素,并将其合理融入现代社会,才是唯一的精神解药。

我想书店的实践正是这样一个过程。

2022-08-10

八月休假记

春节之后疫情爆发,居家办公、照顾孩子,工作上的事情也一直忙活到六月,项目一个接一个,压力甚大。八月份女儿放了暑假,我们抓住八月初的一个空闲,想全家去郊区放松一下。这次选择了门头沟区的几个景点,以前没去过,准备一起看一遍。

第一站定在距离最远的灵山景区,民宿和我家的距离约一百三十公里,驾车三小时。之所以要开这么久,是因为途中有几段盘山路,开不快。

我想起几年前去新疆时开的盘山路,应该是独库公路的一段,在半山腰绕着山转来转去,路边没有护栏,底下就是悬崖,很窄的路上还有对向行驶来的车辆,令人胆战心惊。单车道几乎没法超车,所以经常见到一长串的车,像贪食蛇一样。因为要爬升,有时候还能见到前面的车在头顶的路上行驶,或者后面的车在脚下的路上行驶,都是非常独特刺激的体验。

相比之下去门头沟的路友好多了。海拔低,两侧是茂密的树林,有一种开在地面上的扎实感。我开得不快,但车速也能保持在五十公里每小时。进入灵山景区后又往上开了一段,到达江水河村。我们预定的民宿就在这个村子里,名叫“隐北”。

这家民宿由三座错落的红砖结构建筑组成,屋檐上挂满了藏族风格的装饰,很显眼也很有特色,据说是一家网红民宿。我观察了一圈,它跟周围的民宿比起来,条件确实更好,当然价格也更贵。

我们大约十一点到达,在民宿的餐厅解决了午饭。农家菜,味道不错。下午感到热,想去买个雪糕,依照店家指示找到了距离很近的一个商店,名为“周永堂商店”。

店门紧锁。我按照门上贴的电话号码打了过去,向对方说明来意,电话那头的小伙子说:“你等一下,我找人来开门”。

过了十分钟,一位身材瘦小、头发花白、皮肤黝黑的老太太带着一个小女孩过来开门。我跟她打了招呼,她带我进到屋里。屋里很乱,地上摆满生活用品,一张木桌上摆着剩菜剩饭,可能这里既是小商店又是他们平时生活的地方。老人蹲在地上,从一台家用冰箱的冷冻层取了两支雪糕,收了我十四元。她又拿了一根给小女孩,小女孩开心地拿着雪糕出去玩了。

江水河村的主体修建在一条主街(上山的路)两侧,民宿和饭馆随处可见。这条街约几百米长,像一根磁铁,把两侧的民居、民宿和人们的生活紧紧吸在一起。

晚饭在民宿的露台上解决。太阳落山后,露台上凉风习习,非常舒适。云雾从远处山头飘过来,依稀能听见轰隆隆的雷声。网上说这里晚上能看到银河,可惜云雾浓厚,遮蔽了天空,我们没能一饱眼福。

灵山顶峰海拔2303米,是北京最高的地方。上山的道路有多条,难度不一,我们选择了最简单的一条路。这条路虽然对体力要求不高,但其中一段我们走了野路 — 从齐腰深的野草野花以及茂密的松树林中穿过,开辟出新的道路。女儿紧跟着我们,经过长途跋涉,到达了一座小山的顶峰。望着远处的灵山主峰,我们没有去冲击,大家都累了,且留待下次再爬。

坐在山顶休息远眺,潮湿凉爽的风带着雾气吹过来,脸上和背上的汗珠慢慢蒸发。山下五颜六色的野花开满大地、随风摇曳,云彩在地上投下大块的阴影。半路遇到一支年轻人的队伍,后来在草甸上看到他们在举行团建活动,笑声欢呼声阵阵,融化在微甜的山风里。

龙门涧景区是一处峡谷景观,全长约十五公里。沿路而上,人和小溪交替前行,两侧是高耸的大山,狭窄之处能看到一线天。

相比高海拔的灵山,龙门涧的气温更高,刚进去的一段路体感闷热,但能随时俯身用冰凉的溪水洗去脸上的黏腻,还是很舒服的。

一路基本是平地,女儿跟着我们一路前行,时不时站在小溪里嬉水,玩得很开心。大约走了一个半小时,大家坐在路边休息。听前面回来的人讲,距离终点还有一点五公里。时间已接近正午,众人一致决定就地休整之后折返。返程速度明显加快,一个小时就到了景区入口。一人买了一支雪糕,坐在车上吃,无比惬意。

驱车赶往晚上要入住的名为“爨底下”的古村庄。还没看到村子时便碰到了一个关卡,让买门票,35元一张。这张门票买的有点莫名其妙。

过了关卡再往前开几公里,突然从视野开阔的柏油路开上了像是山洞里才有的土路,本以为走错了路,然后才醒悟过来这就是所谓的“一线天”景点。这段景点的路程也就十几米,一眨眼就过去了,没有留下什么印象。

爨底下于明朝建村,是个有历史的村子。村子规模不大,主街长两百米左右,山村四合院沿着主街向山上排布开去,半山腰有凉亭、关帝庙和娘娘庙。最高处的房子改造成了民俗和老物件的展室。房子外墙上书一行红色大字 — “用毛泽东思想武装我们的头脑”。

我们住的民宿叫“驿清晨”,位于半山腰,两个房间外加一个迷你小院子,要上八十多级台阶才能到达。

办好入住手续,老板娘亲切地说:“您先把行李放这儿,一会儿我们给您送上去。”

房间的阳台很赞,能眺望对面的山和下方的农家。这里空气清朗,晚上看到了星空。

从灵山到爨底下,常见的农家菜有侉炖鱼、豆腐锅、汤面。在驿清晨,我们还吃到了番茄菜花、香椿摊鸡蛋和炸糕,均由老板娘亲自下厨制作,味道可口。早餐也很用心,提前摆好了六样小菜分装在十二个小碟子里,依次排开,让大家眼前一亮。

民宿的前台在一家旅游纪念品商店里。退房的时候我挑选了几张印有村子风景的明信片做纪念,看我要结账,老板说:“这几张送您了,我再送您一套爨底下四季景色的明信片,您留个纪念。”我连忙感谢对方的好意。老板说:“不客气,欢迎您下次再来。”

前面几天的爬山、徒步式旅游让大家都很疲劳,最后两天我们选择住回了市里,在靠近石景山区的龙泉宾馆入住,距离首钢园、八大处景区都不远。

八大处公园是国家4A级景区,有“三山”、“八刹”、“十二景”可供玩赏。然而北京市区气温三十七度,烈日当空,闷热潮湿,在外面走五分钟路就能出一头汗,因此也没有了爬山慢慢游玩的心情。另外这个公园的停车场距离公园大门约一点五公里,在太阳暴晒下走过去也挺难受的。

寺院古刹虽未观赏,但滑道带来了意外惊喜。由不锈钢制成的U型跑道从山上弯弯曲曲下来,让人联想起钢架雪车的赛道。人的坐骑是一辆小车,车上有一个坐垫和一个把手,把手能控制加速和刹车,底下是四个小轮子。如果孩子和大人一起乘坐,还有双座型的小车。从山上开下去,非常有趣。按照工作人员的指导,畅畅还学会了在过弯道时侧身来保持稳定。结束的时候我们都觉得太短了,没玩够。畅畅开心地说:“太刺激了,我下次一定还要再来一次!”

我们原计划暑假旅行去山东的,但考虑到疫情风险选择了不出京。事实上,我们结束休假当天就出现了“海南三亚因疫情造成八万游客滞留”的新闻。

在门头沟时,我们一周都没戴口罩,呼吸山里的新鲜空气,但回到市里,回到社区,大家又不自觉地戴上了口罩。疫情期间,出趟门不容易,且玩且珍惜。

2022-03-11

Holding the Mouse Again

My team is short of designer for the past few months. In order to meet very aggressive deadlines, I had to step in to design some product features. As a manager, I never completely give up hands-on work. I design here and there, mostly small features. But the past month or two is not the same. It’s like going back to an IC again, plus lots of meetings to attend.

I pick up the keyboard and mouse. I open up Figma. I discuss heatedly with PMs. I read each word in the product spec. I fight. I compromise. I struggle with the right words to use. I worry that my simple design would bring down metrics. I argue with PM about priority. I dig into research findings. I think and write. I come up with solutions. I throw away solutions. I give presentations and explain rationales…

By temporarily switching to another mode, I meet my inner drive again - the desire to make things.

I am not saying that I delivered some flawless greatness. I am just saying whenever I pick up my tools, I feel the drive of making the best design that I am capable of making. And that feeling is great.

2022-02-06

打破气泡

“先生您几位?”

我伸出一个手指头。

“一位是吧,您随便坐吧。”

面馆离我家很近,我经常来吃,已经熟门熟路了。时间是中午十一点半,店里座位差不多有一半还空着。再过半小时,店里就会座无虚席。服务员就会忙得脚不沾地,顾不上在大堂迎来送往了。

我随便找了个地方坐下,掏出手机扫描点菜的二维码。头顶音箱里播放着 remix 版的《白天不懂夜的黑》。

天气预报说今天最高温度零下十一度,是入冬以来最冷的一天。我走过来的路上确实感觉冻手冻脚,但此刻坐在热气腾腾的面馆里就感觉不到了。看着窗外明亮的阳光,身上暖烘烘的。

刚才来的路上发生的事让我有些烦躁。事情的原委是这样的:两个月之前我因为撕脱性骨折做了一个脚踝手术,在家休养了两个月。今天是我第一次出门,想去吃碗面,顺便走走活动一下脚。我沿着熟悉的路慢慢向前迈步,让受伤的脚努力适应发力的感觉。一路上我充满好奇,两月未见,所有事物看上去熟悉又陌生。自行车库的木门似乎变干净了,垃圾桶的位置往右挪了几寸,小区门口的门禁摄像头蒙上了一层细灰,大槐树的枯树枝又掉了几根。

就这样边走边看,我到了马路边。已经能看见面馆的招牌了。因为要横穿马路,我停下来仔细观察两边。腿脚不方便,我可不想因为什么情况让脚再次受伤。

像小学生那样左顾右盼了几次之后,我迈开步子。还没走几步,一辆轿车突然从旁边的小巷子里冲出来。它开上马路之后也丝毫没有减速的迹象,就好像根本没看见我这个行人。我被吓住了,呆立在马路中间。看着轿车离我越来越近,身体竟然没法动弹。受伤的那只脚突然刺痛,似乎预示着什么。

“吱”的一声,轿车在我鼻子底下停住了。空气里弥漫着橡胶的焦糊味,仿佛谁的梦被烧死了。我还没反应过来,愣愣地盯着车头。

“喂,你在干嘛,没看见这有车吗?” 一位女性从驾驶座那一侧下车走过来,怒气冲冲地对我喊。

“唔…”

面前这位女士大约四十岁,身穿一套粉色的 Hello Kitty 睡衣,脚上穿着粉色 Hello Kitty 拖鞋。她没有化妆,头发又硬又干,像铁丝一样胡乱盘在脑后,用一个大号的粉色发卡固定着。此刻已有几缕散落下来,垂在眼前。她脸色苍白,有浓重的黑眼圈,眼睛肿着,好像刚哭过。她这副模样倒让我产生了几分怜悯之心。

看我没动,睡衣大姐继续嚷:“赶紧让开,我还有急事呢!”

我盯着她,她也盯着我,我们用眼神对峙着。四周突然安静下来,仿佛周围空间形成了一个气泡,把我和睡衣大姐,还有这荒唐的场景包在里面,气泡外的人根本看不见这里正在发生的事。

让她走吧,我心想,这一切可能只是我的梦。我伸出手,做了一个请的姿势,然后慢慢迈开步子,朝着面馆走去。

看到我的反应,睡衣大姐愣住了,但我早就穿过马路,走到面馆跟前了。

头顶音乐变成了《用心良苦》。一位年轻的女服务员站在我面前。她说:“先生,你点的大碗刀削面。”

我点点头。她把碗放在桌上,说了句请慢用。我觉得她有点生气。

她穿着店里统一的白衬衫和黑裤子,腰上围着蓝围裙。她背影单薄,步子有点蹒跚。也许是新来的吧,我以前没见过她。

年轻姑娘走到后厨,把托盘放在不锈钢桌面上,靠着墙蹲了下来。我依稀感觉她脸色苍白,但距离太远,看不清她的表情。

一位年龄稍大的服务员看到她那副样子,满脸担心地走过去。

大姐说:“你怎么了?哪不舒服吗?”

姑娘说:“没事,姐,我没事。”

可她明明就有事。

“没事就快起来吧。现在正忙,别让老板看见你这样。”

姑娘点点头,手扶着墙费力地站起来。

大姐担心地说:“你真没事?”

“嗯。”

姑娘拿起托盘,走向传菜的窗口,后厨按铃叫人了。

她和大姐口音很像,也许是经大姐介绍来这打工的,可能是老乡或亲戚。

啪的一声,瓷碗掉在地上摔碎了。周围谈话声迅速低了一下,但马上又恢复了。饭馆里打碎一只碗再正常不过了。那姑娘手足无措地站在一地残渣前,像要哭出来。老板走过来了。老板穿着一身旧西装,中午店里忙,他总会加入大伙儿一起给客人上菜。他拦住正要蹲下去捡碎瓷片的服务员:“哎哎,你别用手捡,快去拿扫帚扫。” 姑娘闻言,手猛地往回一缩。她仍蹲在那里,低着头,不敢抬眼看老板。

大姐已经拿着扫帚和簸箕过来了。她一边用扫帚麻利地把四散的碎片归拢到一起,一边说:“红,快起来吧,别蹲着了,怎么这么不小心!”

小红站起来,唯唯诺诺地冲着老板说:“对不起,老板。”

老板倒是大度,脸上没有一点不高兴。他爽快的说:“没事,快去忙吧,以后小心点。”

大姐把碎瓷片扫进簸箕里,用胳膊肘捅了捅小红。小红赶紧把塑料托盘从地上拿起来,走回了后厨。一切又恢复了正常。

小红跑回后厨之后,没去干活,而是一个人站在墙角低着头哭。

大姐看见她,明白肯定是有什么事情。她放下手里的活计,低声但坚定地询问。小红支支吾吾地说,姐,家里刚才出事了,李飞他,他出车祸没了。

大姐惊讶得捂住了嘴。

小红抽泣起来。大姐双手抱住她,让她把头埋在自己肩膀上,还用手轻轻拍打她的后背。后厨和其他服务员都在忙,没注意到她们。小红的肩膀上下起伏,她的心可能像刚才那个瓷碗一样碎了。她头顶上方的墙面上有一只沾满油污的挂钟,此刻正好指向十二点。

可能是察觉工作时间这样的行为不妥,小红很快就跟大姐分开。她用袖子抹抹眼泪,强迫自己镇静下来。大姐仍紧紧抓住她的手,虽没说话,但大姐的眼神给了小红力量。小红呜咽着说:”姐,我没事,咱干活吧,别让老板看见。”

大姐点头。

小红转身要去传菜窗口,大姐又一把把她拉回来。她帮小红抹了抹脸上残留的眼泪,紧紧抓着她的手说:”红啊,红啊,有姐呢,没事啊。”

小红点点头,说,嗯。

两人又恢复了忙碌的状态,尤其是小红 —— 她的薄嘴唇紧紧抿着,红肿的双眼瞪得大大的,脚步匆匆,双手翻飞,给客人点单、上菜、收拾碗筷、擦桌子,游刃有余,就像在表演某种优美的舞蹈。

我从面馆走出来,站在明媚的阳光下。路边分明停着之前差点把我撞翻的那辆轿车。我走过去,心情似乎又进入了气泡里。车主人不在,我掏出钥匙想要报复一下。划车的行为很小人,但我顾不上那么多了。可当我走到车旁边,奇怪的事情发生了。车玻璃上竟然出现了小红的倒影 — 她还在跳舞,腰间的围裙上下翻飞,宛如一只美丽的白天鹅。刚才如果不是听到她们的对话,我绝不可能相信她即便经历了那样的变故,却还能跳出这样的舞蹈。不,她更像是刚刚习得了某种盖世神功,正准备去打败生活中的一切对手。

啪,气泡破了,四周的噪音重新进入我的耳朵。我收起钥匙,慢慢地走开了。

2022-01-16

月亮

站在明亮的大堂

我怀念寒冷的北风

它把我的脊背压弯

又叫我抬起头

河水流过我的身体

又穿过密密的蚁群

我叫出的无声音符

坠入安静的湖水

流动的星空

将我扯远

月亮照在原野上

哼着无声的歌

2021-12-22

Dynamics of the PM & Designer Partnership

I’ve worked at several large tech companies from China and the US. Many people asked me about how PM and Designer work together in local companies v.s. US companies.

The biggest difference is the dynamics of the partnership. PM and Designer are usually responsible for defining the why, what and how for the R&D team. It’s impossible to draw a clear line to divide the work between them. It’s not necessary. It’s even preferred to have some blurry area. PM and Designer can then figure out the best way for them, as long as they ensure high-quality output.

In US companies, PM focuses more on the why and what. (Amazon’s Working Backwards approach is a good example.) Designer focuses more on the what and how. This is ideal from Designer’s perspective.

In local companies, PM focuses more on the what and how. Designer focuses on the how. PM often includes wireframes in the product spec. It leaves very little room to Designers. And in reality, many Designers accept that and only work on the visual part. It turns into a vicious cycle. People rarely think of Design’s exploration role. Design’s value suffers.

There are many reasons. To name one, pursuing speed forces teams to emphasize execution.

The question is how to break this cycle. Designers need to show their willingness and capability to think big and deep. Use every chance to improve the dynamics between oneself and PM.

Start changing the macro environment by changing the partner’s bias first.