AI產品經理的入門必修——概念篇

2020-12-04 人人都是產品經理

編輯導語:隨著各行各業的豐富,產品經理的崗位職責也越來越細緻;如今科技發展迅速,AI人工智慧已經開始深入生活中,AI產品經理也需要掌握一定的技能;本文作者分享了關於AI產品經理的學習概念分享,我們一起來看一下。

經過近幾年來的發展,產品經理的崗位職責劃分的越來越細,對能力的要求也越來越高。

很多剛接手做AI產品的童鞋會困擾,到底需要對人工智慧技術掌握到什麼程度才能夠勝任好這份工作;筆者通過自身的學習經驗,期望能以此篇文章為剛入行或者想入行的童鞋打開一些學習思路。

一、工欲善其事,必先利其器

AI產品經理除了要掌握通用的產品技能,需要具有更強的專業性、廣博性和條理性;AI技術作為一種新的生產力,處理了過往技術無法處理的複雜的非結構化數據。

很多人在使用機器學習時,喜歡簡單粗暴的將數據丟給算法模型,期望從數據中自己得到結論;AI絕不是將手中的數據餵給它,就能夠解決我們的業務問題。

很多公司老闆容易AI超神論,認為我們掌握了技術,擁有了人才,就能夠建立自己的護城河;作為產品經理需要清楚的理解機器學習的使用場景和邊界,清晰定位問題才能尋找新的市場機會。

1. 產品規劃:五看三定原則

五看三定模型其實是華為的戰略管理框架,現在把它結合到產品的工作中。

1)五看包括:

看行業/趨勢:

結合公開的行業數據、現有的業務數據、產品數據分析未來趨勢走向,為業務發展尋找新的增長點。不僅要看宏觀的經濟因素還要從群體思想、政治關係等角度去切入,可以結合PEST方法進行分析,即政治、經濟、社會、技術分別分析企業的外部環境。看市場/客戶:確定需求強度,需求可替代性,以及客戶的持續付費能力。

看競爭:當前市場的競爭態勢,有多少玩家在裡面,分別佔據了怎樣的市場份額。

看自己:評估內部資源,現有的產品矩陣。

看機會:是否存在彎道超車的機會,做到人無我有,人有我優。

2)三定包括:

定控制點:簡單可理解為一種不易被構建及超越的中長期競爭力,控制有不同的維度,如成本優勢、功能性能的領先、技術的壁壘、品牌與客戶關係、絕對的市場份額等。

定目標:制定清晰的戰略目標,並拆解為最小任務,分步執行、監控、評估。

定策略:策略即戰術,策略的制定決定了後續的資源分配、系統如何組成。

2. 選擇產品類型

在開展新的業務線時,首先問自己幾個問題:我們的護城河在哪?最終產品形態是什麼樣子?我們為市場提供了怎樣的解決方案?服務方式?服務能力?

面對不同的業務線首先要做到戰略洞察所處環境與價值分析,制定清晰的戰略目標和策略,通過五看三定原則合理的找到產品定位。

先髮型產品:

擁有最快路徑、利用產業升級進行驅動、建立核心門檻和護城河、資源消耗輕、塑造行業標準。

趕超型產品:

擁有最優路徑、差異化的競爭驅動、對標核心競品,尋找機會、研發資源投入較多、達到行業標準以上、做好客戶服務。

二、數據需要懂多少?

1. 建立數據認知

數據與信息的關係:

數據反映在事物屬性的記錄上,而信息是具體事物的表現形式,即數據經過加工和處理後,可揭示和轉化為信息。

信息被識別後表示的符號為數據。

數據可以是連續的值比如聲音、圖像,也可以是離散的值,比如文字、符號;計算機系統中,數據是以二進位0、1形式表示;結構化數據和非結構化數據:

結構化的數據簡單可以理解為資料庫中的數據,可以結合具體的使用場景易於理解的數據。

非結構化的數據是指沒有進行預定義,並且不方便用二維邏輯來表現和解釋的數據,比如文本、圖片、音頻、視頻。

何為髒數據:數據不再我們預先定義的範圍內或對實際業務無意義。

2. 了解數據的業務內涵

理解數據的業務內涵是非常關鍵的一步,這要求產品經理對業務的各個流程和關鍵節點要非常的熟悉,理解數據代表的含義;遇到模糊、定義不清晰的數據要充分與業務部門溝通,準確了解數據內涵。

業務數據包含但不局限於:

用戶數據:用戶ID、性別、年齡、地區、手機號…行為數據:點擊、分享、收藏、停留時間…產品數據:商品數據、訂單數據、文章數據、詳情頁數據…業務指標包含但不局限於:

用戶指標:新增用戶、活躍用戶數、留存用戶數..行為指標:訪問次數、轉化率、轉發率、流失率..產品指標:總量、收入、銷量、好評率、差評率、成交量…業務數據不獨立存在,基於不同的業務背景可傳達出不同的含義,數據的計算重組可發揮出極大的業務價值,需要基於自身的工作場景挖掘數據內涵。

3. 數據處理流程和方法

數據處理流程包含了數據採集->數據處理->數據分析->數據應用->持續跟蹤和驗證。

數據採集:

數據處理:

數據分析:

數據應用:

除此之外根據具體要解決的業務問題,還需要完成業務建模、數學建模、經驗數據分析,此部分通常由數據分析師進行,產品經理涉及較少。

三、機器學習是什麼?

機器學習為計算機提供了不同的數據處理方法,這些處理數據的方法可以直接從數據中學習,不需要額外的編程即可做出預測。

我們可以將機器學習簡單理解為函數,像理解y=x 一樣,給到一個輸入項,通過公式的計算即可得出一個對應的計算結果;這個公式不需要編碼預設邏輯,由數據的規律計算得出。

機器學習過程分為訓練階段和預測階段。

訓練階段需要提前準備一定的歷史數據(即公式的x和y),通過機器學習算法,訓練出一套可計算的公式(即模型)。

預測階段就是拿真實的數據(x),在訓練好的模型上進行輸入,觀察輸出的結果(y),是否符合預期,若符合預期即完成了一個機器學習模型的訓練。

1. 從任務來看

機器學習解決的問題可以歸為分類問題、預測問題。

分類問題包含二分類、多分類,顧名思義,二分類問題是非此即彼的問題,如垃圾郵件,只存在是垃圾郵件、不是垃圾郵件。

圖片識別問題,是植物不是植物。

多分類問題如文檔自動歸類,包含了一對多,多對多的關係。

預測問題通常第一反應就會想到回歸,因為常被用來預測公司收入、業務增長量、商品銷量。

需要預估的通常都是連續值,試圖將輸入變量和輸出用一個連續函數對應起來。

而分類問題,通常預測的都是離散值,試圖將輸入變量與離散的類別對應起來。

還有一類特殊的解決問題的模型為結構化學習模型,通常輸出的數據不再是一個固定長度的值,比如圖片語義分析,對應輸出的是圖片對應的文字描述。

2. 從機器學習方法來看

機器學習分為有監督學習、半監督學習、無監督學習、遷移學習、強化學習。

有監督:訓練樣本帶有標籤;半監督:訓練樣本部分有標籤,部分無標籤;無監督:訓練樣本全部無標籤;遷移學習:把已經訓練好的模型參數遷移到新的模型上來幫助新模型的訓練;強化學習:也叫學習最優策略,是可以讓本體在特定環境下,根據不同狀態做出行動,以此來獲得最大回報。

3. 從模型類別來看

機器學習模型主要分為線性模型、非線性模型。

線性模型是指因變量和自變量之間按比例表現出線性對應關係,包含了線性回歸、多項式回歸。

公式表現為——h(x)=w1x1+w2x2++wnxn+b

非線性模型通常是指因變量與自變量間不能在坐標空間中表現出線性對應關係。

常見的SVM、KNN、決策樹、深度學習都屬於非線性模型。

提到線性、非線性模型,我們必須要了解一下什麼是損失函數,通常在模型訓練的過程中,我們需要觀察h(x)與y之間的差距,也就是均方誤差,在線性模型中表現為L(h)=m∑i=1(y(i)h(x(i)))2,在模型訓練過程中,損失函數是作為度量函數好壞的標準。

需要注意的是在面對不同的問題時,所使用的損失函數形式是存在差異的,常見的損失函數有均方差損失函數、交叉熵損失函數、合頁損失函數,通常會配合不同的算法使用做出突出表現。

4. 常見的誤差

泛化誤差:可以分解為偏差、方差和噪聲之和。

偏差:反映了模型在樣本上的期望輸出與真實標記之間的差距,指模型本身的精準度,以及擬合能力。

方差:反映了模型在不同訓練數據集下學得的函數的輸出與期望輸出之間的誤差,通常是為了測試模型的穩定性,觀察預估結果的波動情況。

在模型訓練過程中,需要根據實際情況來權衡模型的複雜度,使偏差和方差得到均衡,以整體誤差最小的原則去評估。

5. 常見的問題

模型訓練中常常遇到欠擬合、過擬合的情況,那麼怎麼識別及解決呢?

欠擬合:通常是指模型刻畫不夠,解決方案通常有三種。

尋找更好的特徵提升數據刻畫能力。增大數據集數量。模型複雜度低,重新選擇更加複雜的模型。過擬合:與欠擬合相反,模型刻畫太細,泛化能力太差。

通常解決方案為:

減少特徵的維度,將高維空間密度增大,也就是通常說的降維。加入正則化項,使模型褶皺減少,更加平滑。

四、算法需要懂多少?

確認算法的流程通常是由產品經理和算法工程師共同完成,包含:需求確定 -> 算法設計 -> 算法討論 -> 算法確認 -> 算法驗收 -> 持續改進。

算法模型的選擇和訓練是個繁瑣且複雜的過程,依賴於具體所解決問題的複雜程度。產品經理除了要明確定位要解決的核心問題,還需要了解模型訓練的整個流程。

很多人會說產品經理不需要了解這麼多,不是還有算法工程師嗎?

理想情況下,如果你的算法工程師能夠充分了解要解決的業務場景,並將數據可解決問題的上限、下限劃定清楚,產品經理只需驗收數據效果即可。

但通常情況下,算法工程師距離業務線較遠,而機器學習強依賴於數據表現,產品經理對業務數據的識別能力,通常能夠極大的加快整體進度,在訓練過程中能夠及時識別問題並調整策略及解決方案。

產品經理對算法的掌握到底需要達到什麼程度呢?

個人認為只需要掌握常見算法模型的原理和使用場景,以及不同算法在解決不同問題的優勢和劣勢,合理組合和使用即可滿足日常的工作需求。不需要糾結於具體的算法推導過程。

五、機器學習常見的算法模型

針對不同的使用場景,scikit-learn(python機器學習庫)上有封裝好的機器學習算法模型可以支持我們直接調用。

下圖為人工整理的關於不同場景及數據集下建議使用的算法模型,僅供學習和參考。

下期將介紹具體的機器學習訓練過程,包含如何梳理業務邏輯、需求轉化、準備數據集、建立算法模型、模型評估及訓練過程中常出現的問題與解決方案。

#專欄作家#

人人都是產品經理專欄作家,《數據產品經理修煉手冊》作者。

本文原創發布於人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基於CC0協議。

相關焦點

  • 關於AI學習方法的思考——產品經理入門人工智慧
    現在AI越來越熱門,很多產品經理都想抓住這個機會窗口,進入AI領域成為AI產品經理。也許你經歷過了媒體上各種AI遠景的洗腦、趨勢文章的衝擊以及技術文章的打擊,現在的你,是不是發現自己已經完全蒙圈了?也許你已經嘗試的找過書籍資料、網上課程或培訓機構,是不是並沒有發現成熟的AI產品經理入門學習方法?
  • AI產品經理必修——揭開算法的面紗(餘弦定理)
    餘弦定理作為初中課本就學過的知識,AI產品經理將會把它運用到相似度計算當中。然後,就是最重要的一步,結合分詞結果,得到一個64000維的向量,比如是這樣的:好了,現在對於每一個輸入,無論這篇文章多長,
  • 入門公開課 | 產品經理的宏觀能力、中觀套路、微觀體感是什麼? |...
    當你開始著手入門一個新領域的時候,一定要先給自己畫一個知識地圖但據我們觀察,80%的人在入門產品的時候沒有清晰的學習規劃,往往都是學到哪算哪,撿到啥學啥。如果你明白產品經理的能力分為三個層級:宏觀能力、中觀套路、微觀體感,那麼你入門時的方向感和規劃性就會強許多。1.什麼是宏觀能力?假設你是二零一幾年的程維,你如何帶領滴滴走向出行領域的獨角獸?
  • AI產品經理必修:揭開算法的面紗
    概念一:馬爾可夫假設隨機過程中各個狀態st的概率分布,只與它前一個狀態st-1有關。舉一個例子,我們可以把S1 ,S2,S3…St…看做北京每天的最高氣溫,這裡面的每個狀態St都是隨機的。理論上,任何一天的最高氣溫St取值都可能和這段時間以前的最高氣溫是相關的。
  • AI產品經理的入門必修課(4)——知識圖譜
    編輯導語:通過知識圖譜,不僅可以將網際網路的信息表達成更接近人類認知世界的形式,而且提供了一種更好的組織、管理和利用海量信息的方式;本文作者分享了關於AI產品經理的知識圖譜簡介以及利用,我們一起來了解一下。
  • AI產品經理需要了解的語音交互評價指標
    enjoy~最近,在飯糰「AI產品經理大本營」裡,有團員提問:如何制定針對自然語言語音交互系統的評價體系?有沒有通用的標準?例如在車載環境中,站在用戶角度,從客觀,主觀角度的評價指標?1、準確率、召回率附上之前文章《AI產品經理需要了解的數據標註工作入門》中,分享過的一段解釋:準確率:識別為正確的樣本數/識別出來的樣本數召回率:識別為正確的樣本數/所有樣本中正確的數舉個慄子:全班一共30
  • AI產品經理的定義和分類
    例如,雖然「AI產品經理」是2016才開始被行業提及,但我在2012年設計「語音助手」app的時候,確實已經在接觸語音識別、語義理解等AI概念和技術細節了。 作為一個新職位概念,「AI產品經理」的定義和分類,是網際網路產品經理以及AI從業者都非常關心的。本文,我將嘗試提出自己的觀察和總結,拋磚引玉,希望能促進行業對「AI產品經理」有更多的重視和思考。
  • 分布式光伏基礎概念(入門篇)
    分布式光伏基礎概念(入門篇)發表於:2016-05-11 00:00:00     來源:中電電氣民用光伏分布式定義是指位於用戶附近,所發電能就地利用,以10KV(千伏)、220V、380V等級接入電網,且單個併網點總裝機容量不超過6MW(兆瓦)的光伏發電
  • AI產品經理需要了解的概率論通識:4個概念3個問題
    筆者基於工作實踐,分享了非常實用的4個概率論概念和3個經典的概率論問題,供大家參考學習。我認為AI產品經理應該學一些概率知識,是否理解概率,直接決定一個人對AI智能的了解程度。
  • 踏入AI領域,這些數學基礎一定要打好
    對於初學者來說,它是人工智慧入門的基石。若是學習初期囫圇吞棗,往往會在算法出現accuracy不好、loss很高、模型已經overfitting的時候,才後悔沒有好好掌握基礎的數學理論。從事機器學習研究有近10年的歷史,發表10多篇SCI論文,在機器學習理論授課方面有著豐富的經驗。二、課程5大亮點1、名師授課蔡佳老師從事機器學習研究有近10年的歷史,發表10多篇SCI論文,在機器學習理論授課方面有著豐富的經驗。
  • 想入門人工智慧? 這些優質的 AI 資源絕對不要錯過
    那麼對於想入門人工智慧的人群來說,應該從哪兒開始呢?本文列出了一些優質AI學習資源。希望在閱讀本文後,能幫助你順利開啟AI學習之旅。該課程旨在面向有抱負的工程師,從人工智慧的基本概念入門到掌握為人工智慧解決方案構建深度學習模型所需技能。當中提供十門課程,加上一個頂點項目,這些課程都是免費的,如果你需要認證證書則需要付費。當中包含的課程很不錯,例如AI所需的數學基礎入門,以及數據分析中的倫理學和法律課程。
  • 產品經理如何寫出一份「簡練」的PRD
    導語:寫好PRD文檔是產品經理的必修功課,但這門「必修課」卻沒有統一的課本和答案,本篇文章適用於初入職場的產品新人。本文作者工作於BAT大廠,工作期間寫過多份PRD,將結合作者個人經驗並結合大廠同事的寫法,總結一下如何寫出一份「簡練」的PRD。
  • AI產品經理的必修課:系統化思維
    產品經理要養成一個習慣,精確定義身邊的所有問題,一些現象到底是什麼?哪怕友情,溝通,都可以定義。定義的標準就是可以在任何一個場景可以復現。產品經理對用戶體驗的決定權就好比一個導購把產品高價賣給了老人。產品經理的設計能力可以左右用戶體驗,但根本上是由輸入輸出設備決定的。老式觸控螢幕是單點觸控,滑鼠也是單點,體驗特別像PC,單點沒有好到可以代替鍵盤,因為滑鼠配鍵盤是最好體驗。所以單點觸控螢幕最後不如iPhone。
  • 微信產品經理:我的產品之器——Sketch
    John的產品之器系列最近會持續更新,產品經理們可以繼續關注雷鋒網,或者移步其知乎。最近看知乎的時候發現了一篇很棒的文章,特地拿過來與大家分享,尤其推薦給產品經理或想成為產品經理的你。以下是原文:算上創業,我做產品差不多三年。我一直在問自己,做產品經理最重要的特質是什麼?
  • 產品經理的進階之路(2):如何搭建產品經理的知識體系?
    在上一期發布搭建屬於自己的知識體系之後,後臺收到了很多朋友的問題,今天我們就詳細來說說產品經理的知識體系有哪些內容。每一個產品經理,應該都需要根據自己的職業生涯規划去收集資料搭建自己的知識體系。明確自己職業規劃我們需要在搭建知識體系之前明確自己職業規劃,才能夠去建立知識體系的框架,還記得剛進入產品經理這個行業時,看到的一張產品經理成長方向的圖,他分為了4條線:產品經理到產品專家(技術線),在這條線上,產品經理需要側重產品側知識體系,包括用戶本質訴求的洞察能力
  • AI產品經理需要了解的數據知識:餘弦相似度
    本文概括介紹了餘弦相似度是什麼、如何應用以及案例說明,目的是希望我們產品經理在設計相關跟相似度功能或是利用相似性功能解決某一業務的場景時能利用上餘弦相似度,並希望您讀完對自己在設計相關推薦業務、搜索業務、識別業務時能有更深層次的理解。
  • 【入門篇】走近思維導圖
    思維導圖的核心概念是哪些?----關聯我,請掃碼備註-----往期相關信息-【入門篇】思維導圖中的圖像——繪製姓名籤【入門篇】思維導圖的三種樣貌【工具篇】思維導圖學習之旅一【軟體篇】教你用xmind軟體製作思維導圖【導圖應用】整本教材書的閱讀——《三維設計與創意》【應用篇】一次清洗油煙機的發現【學科篇】由期末英語考卷中的思維導圖說起【學科篇】讀名著畫思維導圖【案例篇】讀《讓項目式教學落地:江蘇高中信息技術名師的教學設計》【案例篇】我與人工智慧的故事導圖
  • 高中數學入門篇之函數(上)
    高中數學入門篇之函數(上),尖子生數理化教育圖1剛上高中學數學的第一本書,就是必修1,這本書中的第一章便是函數,第一節的內容是集合,是為後續學習函數進行的鋪墊!我們進入高中,必須將初中的相關基礎知識牢記,同時還不能帶著初中的學習思維來進行高中數學知識點的學習。
  • 高一數學篇:兩角和與差的餘弦公式(必修1)
    必修1--第82課時:兩角和與差的餘弦公式
  • 數據分析實戰|人人都是產品經理網站(上篇):平臺視角
    所以這個分析將將可能得出產品經理們的能力變化和工作變化。從左往右按年份來看:2012~2015可能還是產品經理在行業內剛開始冒頭的時候,所以產品經理的主要工作:產品設計、產品運營、產品經理大家都還不太敢寫,或者說能寫的人還很少,主要就是分析行業和轉載報導當前的行業趨勢;2016