用嘴開發(fā)小程序日志——安心聲音
在AI技術(shù)的浪潮中,編程和產(chǎn)品開發(fā)的門檻正在被逐步打破。本文作者通過(guò)AI編程技術(shù),從零開始開發(fā)了一個(gè)名為“安心聲音”的小程序的全部經(jīng)歷,供大家參考。
年前學(xué)會(huì)了AI編程的入門技巧,做了個(gè)《定制新年問(wèn)候表情包》的小網(wǎng)站。當(dāng)時(shí)很興奮,但是最終卻沒(méi)能發(fā)揮什么作用。
于是我陷入沉思,我覺(jué)得我“有了AI編程這個(gè)錘子,目前缺一個(gè)好的釘子”,還是得找到生活中的“真需求”……
直到最近,我發(fā)現(xiàn)小紅書上有條帖子。是一個(gè)獨(dú)立開發(fā)者在問(wèn)大伙需要什么APP的。有個(gè)回復(fù)是這么說(shuō)的,希望有這樣的APP:
獨(dú)居女性APP,里面都是男性的聲音,放大音量,讓門外聽(tīng)到家里有男的,有狗。音頻內(nèi)容有,誰(shuí)啊?再敲門?
和我老婆討論了下,這個(gè)需求的存在是因?yàn)椤蔼?dú)居女性”是一個(gè)有一定風(fēng)險(xiǎn)的屬性,也時(shí)常會(huì)發(fā)生一些危險(xiǎn)的案件。所以會(huì)通過(guò)一些措施來(lái)偽裝成“非獨(dú)居女性”。最簡(jiǎn)單的就是各大外賣、快遞平臺(tái)的性別改成男的。
以上為DeepSeek找到的案例。
這背后也說(shuō)明了“獨(dú)居女性”存在一定的“風(fēng)險(xiǎn)防控”需求,在某些情況下,她們需要盡可能地減少風(fēng)險(xiǎn)事件的發(fā)生,保證那些需要“報(bào)警”應(yīng)對(duì)的情況不會(huì)發(fā)生。
那么為什么是用“發(fā)出聲音的”程序來(lái)滿足這種需求呢?
大部分“獨(dú)居女性安全指南”都指出,可以通過(guò)“注意與規(guī)避危險(xiǎn)情況”、“偽造非獨(dú)居女性的跡象”、“購(gòu)買安全措施(監(jiān)控類、報(bào)警類、防身類)”等方式來(lái)盡量避免風(fēng)險(xiǎn)。
“注意與規(guī)避危險(xiǎn)情況”這種屬于個(gè)人行為,目前無(wú)法使用程序來(lái)解決。(除非發(fā)展出帶有用戶環(huán)節(jié)和行為識(shí)別的穿戴設(shè)備,以及基于識(shí)別情況進(jìn)行決策的AI能力。)
“購(gòu)買安全措施(監(jiān)控類、報(bào)警類、防身類)”這類方式已有很多成熟的產(chǎn)品,上網(wǎng)就能買到對(duì)應(yīng)的內(nèi)容,比如防狼噴霧、報(bào)警器……
以上兩個(gè)方向用產(chǎn)品功能滿足的可行性不高,只能聚焦于“偽造非獨(dú)居女性的跡象”這一點(diǎn)。
在這個(gè)方向上,目前只能看到“偽造外賣、快遞平臺(tái)信息”、“門口擺放男性鞋子”、“晾曬男性衣物”等手段。這種方式有可能在長(zhǎng)期的接觸與對(duì)接中露餡,比如一個(gè)快遞員經(jīng)常派件,在接觸過(guò)程中都發(fā)現(xiàn)對(duì)接人只有“女性”,加上這種“獨(dú)居女性安全指南”的手段現(xiàn)在大部分人都知道。那么“獨(dú)居女性”的標(biāo)簽是有可能被拆穿的。
那么便可以利用聲音在使得這個(gè)“偽裝”更可信,通過(guò)聲音來(lái)模擬存在一個(gè)“伴侶”,從而保持“非獨(dú)居”的人設(shè)。
由于這個(gè)需求的核心功能十分簡(jiǎn)單,AI coding能完全hold住,結(jié)合目前AI語(yǔ)音技術(shù)非常成熟,因此這個(gè)方向相有可能的。于是我便想用AI編程來(lái)實(shí)現(xiàn)以下我所設(shè)想的這個(gè)小需求。
成品展示
以下是成品展示~
整體上分為兩個(gè)頁(yè)面,預(yù)設(shè)了6個(gè)場(chǎng)景:
- 接聽(tīng)語(yǔ)音:這個(gè)場(chǎng)景下會(huì)模擬一個(gè)男生在與你進(jìn)行微信,并告訴周圍的人,他待會(huì)回來(lái)接你。適用于夜路回家的情況。
- 應(yīng)門聲音:這個(gè)場(chǎng)景下會(huì)模擬一個(gè)男生應(yīng)門,然后讓你去接待。用于告知門外的人,里面是有男生的。同時(shí)也交代了“為什么接下來(lái)是女的在說(shuō)話”。
- 接收外賣:這個(gè)場(chǎng)景下會(huì)模擬一個(gè)男生應(yīng)門,并告知外賣放在門口即可。
- 聚會(huì)社交:這個(gè)場(chǎng)景下會(huì)模擬多人聚會(huì)的聲音,告知里面很多人。
- 咳嗽聲音:這個(gè)場(chǎng)景下會(huì)模擬男生咳嗽。
- 腳步聲音:這個(gè)場(chǎng)景下會(huì)模擬沉重腳步聲。
建設(shè)思路
下面就分享下,我在弄這個(gè)小程序時(shí)候的思路。
產(chǎn)品功能梳理
由于對(duì)這個(gè)功能還僅僅是本人的設(shè)想,未能得到價(jià)值的驗(yàn)證。所以第一個(gè)版本為MVP版本,需要盡量只有核心功能。像是什么“自定義音色”、“自定義語(yǔ)音內(nèi)容”、“自由錄制語(yǔ)音”、“一鍵報(bào)警”這些功能都先砍掉。
先提供幾個(gè)常見(jiàn)場(chǎng)景,把核心的【場(chǎng)景列表】和【音頻播放】功能做出來(lái)。
我這里借用了DeepSeek,讓他幫我梳理功能。雖然他輸出了不少冗余的功能,但是基本上刪刪改改就能繼續(xù)用了。
可行性研究
接著我要進(jìn)行這個(gè)功能的可行性研究,這里除了AI編程之外,需要研究的就是語(yǔ)音內(nèi)容了。
在這里的需求是“真實(shí)”、“沉穩(wěn)”的聲音。因此需要排除機(jī)械感很重的配音(比如剪映上的配音能力),然后需要排除掉過(guò)于優(yōu)美的聲線(比如MiniMax上的各種預(yù)設(shè)音色)。
最后我看到了MiniMax上的聲音克隆。于是我試著找了個(gè)朋友的音色錄制了下,發(fā)現(xiàn)還挺自然。
落地建設(shè)
當(dāng)可行性都研究好后,就是開干的過(guò)程了。主要分為原型設(shè)計(jì)和功能實(shí)現(xiàn)兩步,這里都是用AI來(lái)替我完成的。
用“嘴”設(shè)計(jì)原型
在前面的功能梳理環(huán)節(jié),我已經(jīng)讓DeepSeek幫我生成好了功能的文字描述。我只需要打開Mastergo,把需求輸入進(jìn)去,它就幫我生成了高保真的原型界面。
由于有兩個(gè)頁(yè)面,所以需要分開兩次輸入。以下為我所選擇的成品。
其實(shí)AI的成品還是有不少問(wèn)題的,我們可以選擇在Mastergo上二次修改,或者在AIcoding環(huán)節(jié),讓AI幫我們?nèi)サ魺o(wú)關(guān)的功能。
用“嘴”寫代碼
當(dāng)原型滿意后,我就直接把DeepSeek給我的需求和原型圖,丟給windsurf幫我寫代碼。然后通過(guò)微信開發(fā)者工具調(diào)試。
其中有BUG的部分,就直接截圖圈起來(lái),讓AI幫我修改。
hhh,有種PUA賽博程序員的感覺(jué)了。
最終經(jīng)過(guò)N輪的“用嘴開發(fā)”,這個(gè)僅有兩個(gè)頁(yè)面的功能便完成了。但其實(shí)這里也調(diào)試了我?guī)讉€(gè)小時(shí),還是會(huì)存在指令不到位的情況,當(dāng)然也有我描述不夠詳細(xì)的原因。整體來(lái)說(shuō),Claude 3.7相比起3.5來(lái)說(shuō),還是強(qiáng)大了不少的。
小結(jié)
以上便是這個(gè)《安心聲音》小程序的實(shí)戰(zhàn)小結(jié)了。目前AI coding的發(fā)展速度非???,一些很簡(jiǎn)單的功能已經(jīng)能夠由不會(huì)代碼的人來(lái)實(shí)現(xiàn)了。一個(gè)考驗(yàn)“誰(shuí)更能找到真需求”的時(shí)代正在到來(lái)。
本文由人人都是產(chǎn)品經(jīng)理作者【檸檬餅干凈又衛(wèi)生】,微信公眾號(hào):【檸檬餅干凈又衛(wèi)生】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于CC0協(xié)議
- 目前還沒(méi)評(píng)論,等你發(fā)揮!