ScalersTalk成長會機器學習小組第7周學習筆記

2021-03-02 持續力

Scalers點評:機器學習小組是成長會的內部小組,這是成長會機器學習小組第7周學習筆記

往期日誌:

ScalersTalk成長會機器學習小組第6周學習筆記

ScalersTalk成長會機器學習小組第5周學習筆記(微信有個Bug,無法連結,參見3月23日推送)

ScalersTalk成長會機器學習小組第4周學習筆記

ScalersTalk成長會機器學習小組第3周學習筆記

本周主要內容

優化目標

最大間隔

最大間隔分類的數學背景

核函數

核函數

使用支持向量機

本周主要知識點:
一、優化目標






二、最大間隔的含義

優化求解目標函數:


支持向量機的決策邊界:
當C為一個很大的值:


支持向量機:線性可分場合

支持向量機:最大間隔在存在異常值場合




四、核函數

非線性決策邊界:



模型預測:
對樣本進行預測,具有下面形式:



核函數:



核函數和相似度函數:


核函數例子:



五、核函數

如何選擇標記點:



SVM的核函數:



SVM的核函數:




SVM的參數選擇:



六、使用SVM



核函數的相似度函數如何寫:


記得在使用高斯核函數時不要忘記對特徵做歸一化。

其他的核函數選擇:
並不是所有的核函數都合法的,必須要滿足Mercer定理。
多項式核:
衡量x與l的相似度:

通用的公式:


如果它們是相似的,那麼內積就會很大。

String kernel:
如果輸入時文本字符
用來做分類
Chi-squared kernel
Histogram intersection kernel(直方圖交叉核)

SVM的多分類:
Many packages have built in multi-class classification packages
Otherwise use one-vs all method
Not a big issue

SVM和Logistic 回歸的比較:


六、作業

function sim = gaussianKernel(x1, x2, sigma)x1 = x1(:); x2 = x2(:);sim = 0;sim = exp(-(x1 - x2)' * (x1 - x2) / (2*(sigma^2)));% =============================================================end

dataset3Params.m:

function [C, sigma] = dataset3Params(X, y, Xval, yval)C = 1;sigma = 0.3;smallest_error=1000000;c_list = [0.01; 0.03; 0.1; 0.3; 1; 3; 10; 30];s_list = c_list;  for c = 1:length(c_list)    for s = 1:length(s_list)        model  = svmTrain(X, y, c_list(c), @(x1, x2) gaussianKernel(x1,x2,s_list(s)));        predictions = svmPredict(model, Xval);        error = mean(double(predictions ~= yval));        if error < smallest_error           smallest_error = error;           C = c_list(c);           sigma = s_list(s);        end        end    endend

emailFeatures.m:

function x = emailFeatures(word_indices)n = 1899;x = zeros(n, 1);for i=1:length(word_indices)    row = word_indices(i);    x(row) = 1;endend

processEmail.m:

                                                                                  for i=1:length(vocabList)        if(strcmp(str , vocabList(i)))           word_indices = [word_indices; i];        enden

ScalersTalk ID:scalerstalk

本微信公眾號作者Scalers,遊走在口譯世界的IT從業者。微信公眾號ScalersTalk,網站ScalersTalk.com,口譯100小時訓練計劃群C 456036104

成長會是由Scalers發起的面向成長、實踐行動,且凝聚了來自全球各地各行各業從業者的社群。有意入會者請和Scalers直接聯繫,我和其他會員會和你直接交流關於成長行動等各方面的經驗教訓。2016年成長會持續招募中,參見做能說會寫的持續行動者:ScalersTalk成長會2016年會員計劃介紹(2016.3更新)

相關焦點

  • ScalersTalk書法小組第23周復盤日誌
  • ScalersTalk書法小組第25周復盤日誌
  • ​ScalersTalk書法小組第36周復盤日誌
    -米粥負責啟動了成長會書法小組。現在已經持續行動 36周,如果想加入書法小組,請閱讀下面說明,並點擊查看文章「[ScalersTalk成長會書法小組啟動]」希望你能為自己的選擇有擔當,我們的小組是做事情的。入群準備:完成以下任務後,才可以進入書法小組哦。準備好相關書法使用文具用品。詳見上面連結。臨摹一幅作品。根據你擅長的,在圖文連結挑選顏柳歐趙其中一副臨摹就好。
  • ScalersTalk聽力零階段小組第50周復盤日誌
    ScalersTalk聽力零階段小組是ScalersTalk旗下聽力狂練小組的子群,在零階段小組連續十天聽寫慢速VOA的正確率達到95%以上的成員將被邀請進入狂練小組。詳情請參見[386][ScalersTalk聽力狂練小組成立與行動召集]題目的設置有如下幾種形式:本次復盤分兩個階段進行往期日誌:ScalersTalk聽力零階段小組第49周訓練日誌ScalersTalk聽力零階段小組第48周訓練日誌ScalersTalk聽力零階段小組第47周訓練日誌主持人Mine
  • [956]ScalersTalk法語口譯小組第1周訓練筆記
  • ​ScalersTalk書法小組第45周復盤日誌
    ▲魏碑       圖|書法小組組員Ben我們在去年10月由成長會夥伴
  • ScalersTalk成長會口譯通關行動:交傳小組二級口譯實務第2周訓練日誌
    持續行動是我們最大的戰略優勢,當大多數人在堅持100天以後沾沾自喜的時候,我們的著眼點已經是三階1000天的持續行動了。可能很多人以前連一本書的完整章節都搞不定,但是在成長會交傳小組和口譯基礎小組,我們可以完成一本書從頭到尾持續的學習,如果你完整地跟下來,你會有很大的收穫,而且你也會成就感爆表。
  • ScalersTalk法語口譯小組第4周訓練筆記
    Jeanette 法語口譯小組是ScalersTalk旗下法語高級水平QQ群,由北外法語系研究生領銜組長,帶領小組成員練習,歡迎C1+水平的法語學習者加入。小組每周以「背景資料收集+周末會議口譯」的模式進行。法語口譯小組對外開放,要求和申請方式參見《ScalersTalk法語口譯訓練小組成立,開放申請》。今天分享第4周的練習筆記。
  • [638]ScalersTalk西班牙語小組Unidad 2+Unidad 3學習筆記
    這是ScalersTalk西班牙語小組的學習筆記,如果你是西班牙語學習者想加入交流,請在A/B/C三個群中找Running申請。回復群號可以找到加入方式。Unidad 2+Unidad 3學習筆記目錄第一部分 寫在前面的話
  • [975]ScalersTalk法語小組第52周訓練日誌
    現已推出由北外法語翻譯研究生帶領的法語口譯小組,希望更多高級階段的法語學習者加入。法語口譯小組對外開放,要求和申請方式參見《ScalersTalk法語口譯訓練小組成立,開放申請》。目前這個小組注重中級階段的基礎夯實和翻譯訓練。接下來將推出法語零階段小組,為大家了解這門優美的語言提供一個通道,課程正在緊鑼密鼓的籌備中,敬請期待。群裡周一到周五是翻譯材料,周末一起復盤。
  • [871]ScalersTalk聽力狂練小組第56周訓練日誌
    Week56ScalersTalk成長會聽力狂練小組是ScalersTalk旗下專攻聽力訓練的子群。每日復盤總結模式分為以下幾個方面,請任選一種模式進行整理,並將復盤成果發送到群內:(1)初級模式:對生詞、短語、語音及背景知識進行總結,整理成文字材料發送至群內;(2)中級模式:提取材料中生詞、短語搭配或者句式連接進行造句訓練,並發送至群內。(3)高級模式:對材料進行複述或者summary,提煉要點,並將你的複述或者summary通過語音發送至群內。
  • ​[No.1074]ScalersTalk書法小組第58周復盤日誌
    唐 李白《玉階怨》Kitty作品我們在去年10月由成長會夥伴-米粥負責啟動了成長會書法小組
  • ScalersTalk口譯基礎小組三級口譯第20周訓練日誌
    具體的測試方法在成長會內部有詳細說明(參見1號帖章節1.4交傳小組和口譯基礎訓練小組),我們根據測試的表現,給出等級判定。根據等級的不同分配到對應的訓練小組。口譯基礎訓練小組只對成長會內部開放。對於進群後不行動的,定期清理退群。
  • ScalersTalk口譯基礎小組三級口譯第29周訓練日誌
    口譯基礎訓練項目落在口譯基礎訓練小組,主要以三級口譯實務教材為主,我們的目標也是逐個章節地刷完這本經典作品。這本教材我們在2015年已經刷完過一輪,所以這相當於是第二遍了。如果你缺乏持續行動的能力,那來和我們一起練是最好的選擇沒有之一。口譯基礎訓練小組需要參加測試才能進入。
  • ScalersTalk口譯基礎小組三級口譯第14周訓練日誌
    口譯基礎訓練項目落在口譯基礎訓練小組,主要以三級口譯實務教材為主,我們的目標也是逐個章節地刷完這本經典作品。這本教材我們在2015年已經刷完過一輪,所以這相當於是第二遍了。如果你缺乏持續行動的能力,那來和我們一起練是最好的選擇沒有之一。口譯基礎訓練小組需要參加測試才能進入。
  • [962]ScalersTalk聽力狂練小組第69周訓練日誌
    Week 69ScalersTalk成長會聽力狂練小組是ScalersTalk旗下專攻聽力訓練的子群。每日復盤總結模式分為以下幾個方面,請任選一種模式進行整理,並將復盤成果發送到群內:(1)初級模式:對生詞、短語、語音及背景知識進行總結,整理成文字材料發送至群內;(2)中級模式:提取材料中生詞、短語搭配或者句式連接進行造句訓練,並發送至群內。(3)高級模式:對材料進行複述或者summary,提煉要點,並將你的複述或者summary通過語音發送至群內。
  • [667]ScalersTalk法語小組第8周訓練日誌
    群裡周一到周五是新材料,周末復盤。如果你也想加入我們,這篇文章底部有進群方式。這次復盤的對象是五篇材料,對應《簡明法語教程》上冊第二十七課到第二十九課。每課後面有法語朗讀小組的夥伴們一起總結的知識點和一些補充內容。[法語小組]1. 針對有基礎的同學,語言等級要求是B1以上。2.
  • [No.1063]ScalersTalk新概念朗讀小組第37周訓練日誌
    參見:分享《從朗讀切入英語學習正循環》公開課錄音和PPT。除此之外,我在成長會內部又單獨成立了一個新概念朗讀小組,並且提供專門的課程輔導《如何榨乾一段朗讀材料?》,提供更高級全面的操作步驟,便於成長會內部成員的朗讀交流與進步。新概念朗讀小組已經運行九個多月了,從本周起,本小組開啟了群復盤,希望我們的行動能給你不一樣的思考。
  • ScalersTalk口譯基礎小組三級口譯第33周訓練日誌
    口譯基礎訓練項目落在口譯基礎訓練小組,主要以三級口譯實務教材為主,我們的目標也是逐個章節地刷完這本經典作品。這本教材我們在2016年已經刷完過一輪,所以這相當於是第四遍了。如果你缺乏持續行動的能力,那來和我們一起練是最好的選擇沒有之一。口譯基礎訓練小組需要參加測試才能進入。
  • [653]ScalersTalk法語小組第六周訓練日誌
    法語朗讀小組是ScalersTalk 旗下法語QQ群。群裡周一到周五是新材料,周末復盤。如果你也想一起加入我們的話,歡迎去英語口譯ABC群裡面找Lydie (34587****)。入群任務是一篇講述你學習法語的故事法語小作文,審核通過便會被邀請進群。這次復盤的五篇材料,對應的是《簡明法語教程》上冊第二十二課到第二十四課。