我愛單詞|[重訪《變性人帝國》]文本詞頻分析

2021-01-14 蘊集文化工作室

在公眾號譯文欄目,我們獨家提供了文章『The Transsexual Empire』 revisited: Meghan Murphy in conversation with Janice Raymond 的對應譯文 重訪《變性人帝國》:梅根·墨菲與珍妮絲·雷蒙德的對話

通過對三萬多單詞的原英文文本的詞彙進行分析,摘取出此文的高頻詞彙100個左右,供大家閱讀原文前對需要的詞彙做相應的熟悉與準備。


譯文回顧——

譯文|重訪《變性人帝國》:梅根·墨菲與珍妮絲·雷蒙德的對話(上)

譯文|重訪《變性人帝國》:梅根·墨菲與珍妮絲·雷蒙德的對話(中)

譯文|重訪《變性人帝國》:梅根·墨菲與珍妮絲·雷蒙德的對話(下)


原文地址——

https://www.feministcurrent.com/2020/11/22/the-transsexual-empire-revisited-meghan-murphy-in-conversation-with-janice-raymond/


高頻詞列表

 

高頻詞彙

頻次

含義

Women

66

女子

Lot

40

許多,地段

Trans

38

反式,轉,跨越

People

33

人員

Think

29

思考

Really

27

真的

Gender

23

社會性別

Many

19

許多

Now

18

現在

Out

17

Medical

16

醫學

One

16

Book

16

書籍

Men

16

男子

University

15

大學

Sex

14

Being

14

生命,存在,人

Even

14

甚至

Transsexual

13

變性人

Movement

13

運動

More

13

更多

Self

13

自我

Very

12

非常

Activists

12

積極行動者;行動主義分子

Kind

12

種類;善良

Called

12

稱為

Going

12

Against

11

反對

Things

11

事情

Today

11

今天

Time

11

時間

See

11

請看

Point

11

Feminists

11

女權主義者

Such

10

這種

Well

10

好吧

Transgenderism

10

跨性別主義

Started

10

開始

Happening

10

正在發生

Empire

9

帝國

Radical

9

激進型

Transsexualism

9

變性人主義

Certainly

9

當然了

Up

9

漲幅

Years

9

年數

Saying

9

Around

9

左右

Know

9

知道

Research

9

科研

Identity

8

身份認證

Treatment

8

治療

Studies

8

研究

Male

8

男性

Female

8

女性

Same

8

同樣的

Hormones

8

激素

Way

8

途徑

New

8

新產品

Challenge

8

挑戰

Changing

8

改變

Transgender

8

變性人,變性的

Course

8

課程

Thing

8

事情

Violence

8

暴力問題

Transmen

8

跨性男

Transwomen

8

跨性女

Surgery

7

外科,外科手術

Centers

7

中心

Feminist

7

女權主義

Much

7

Saw

7

鋸,see的過去式

Began

7

開始

Issue

7

問題

Part

7

部分

Those

7

那些

Right

7

右邊,權利,正確的

Identified

7

已確定,已認證

Want

7

想要

Here

7

喏,這裡

Doing

7

Media

7

媒介

Need

7

需要

Still

6

還是

Back

6

返回

Writing

6

寫作

Work

6

工作

Change

6

變化

Bit

6

比特,一點

Beginning

6

開始

Sexual

6

性的;生殖的;性行為的

Universities

6

大學

Legislation

6

立法

Speak

6

講話

Support

6

支持

Published

5

發布時間

Become

5

成為

Control

5

控制

Use

5

使用

Lesbian

5

女同性戀

Over

5

完畢

Wrote

5

寫道

Society

5

社會

Coming

5

來了

Issues

5

問題

Came

5

來了

Itself

5

本身

Based

5

基於

Children

5

兒童

Meant

5

意思是

Themselves

5

他們自己

Quite

5

頗有

Lesbians

5

女同性戀者

Lots

5

很多

Talking

5

談話

Press

5

媒體,出版社,新聞界

Grant

5

贈款

Done

5

完成

Important

5

重要信息



歡迎關注本公眾號,提供給你更多外文文本詞頻分析內容,提高外語閱讀效率。



 

 

 



相關焦點

  • 文本分析初體驗:一個小白的12小時
    我為什麼想起來要去整理頂刊?其實是同事提議的。彼時我還在歡快的吃著火鍋,手機上飄來一條信息:「你們發展心理學最近究竟在做什麼?」一時間竟大腦一片空白,於是我決心用數據說話,也給自己找找方向。本次項目僅出於對領域研究現狀和文本分析的好奇,並以此流程和大家分享一下小白在做文本分析時候遇到的坑,各種畏難情緒,和最後結果。
  • 以《大秦帝國之崛起》為例,來談大數據輿情分析和文本挖掘
    本文作者將以《大秦帝國之崛起》作為分析對象,來詳細闡述在大數據時代數據分析會涉及到的全網輿情分析、微博傳播分析以及文本挖掘。以下筆者就從文本挖掘的角度來分析一下原著小說、觀眾影評等方面的文本分析。3.1 原著小說的關鍵詞提取筆者沒採取一般文本分析時所採用的詞頻統計,因為詞頻統計的邏輯是:一個詞在文章中出現的次數越多,則它就越重要。
  • 樸素貝葉斯分類器詳解及中文文本輿情分析(附代碼實踐)
    內容包括:1.樸素貝葉斯數學原理知識2.naive_bayes用法及簡單案例3.中文文本數據集預處理4.樸素貝葉斯中文文本輿情分析本篇文章為基礎性文章,同時,推薦大家閱讀我以前的文章了解基礎知識。▌一.
  • 手把手教你用R語言分析歌詞(附代碼)
    文本挖掘也可以被認為文本分析。 單詞頻率:每首歌單詞的數量 單詞長度:文本中每個單詞的平均長度 詞彙多樣性:在文本中不單詞的數量(歌曲詞彙) 詞彙密度:不同單詞的數量除以所有單詞總數(字詞重疊) 整潔文本的格式 分析之前,你需要把歌詞分解為一個個單詞
  • 視覺化英語圖文朗讀版:過目不忘單詞program(詞頻 195985)
    點擊 開始播放同步朗讀語音【本期核心詞】本期我們要學的單詞是:program(排行194 詞頻 195985)——方案;計劃。播送(節目)[美] program contemporary works播送當代作品【高頻用法】咱們來看一下這個單詞最常用的各種具體用法:
  • 簡潔詳盡講解文本聚類
    而且,如果你突然看到一個包含先前未使用過的單詞的新文檔,則必須更新每個文檔向量,並為其添加新維度和零值。因此,為簡單起見,假設我們的文檔收集沒有增長。tf-idf請看下面的小玩具示例,其中僅包含兩個簡短文檔d1和d2,以及由此產生的單詞向量包:你會看到,像「我」和「愛」這樣的抽象的單詞會獲得與實際辨別兩個文件(如披薩和巧克力)的單詞相同的價值。
  • 視覺化英語圖文朗讀版:過目不忘單詞substantial(詞頻 14169)
    substantial 同步朗讀語音01:49來自徐瀾江【本期核心詞】本期我們要學的單詞是:substantial(排行 2560 詞頻 14169)——大量的;實質性的。真實的;可觸的 substantial sincerity真實的誠意【高頻用法】咱們來看一下這個單詞最常用的各種具體用法:a substantial salary豐厚的薪水substantial sums/numbers of相當多的substantial assets
  • 文本分類六十年
    文本分類文本分類流程在許多自然語言處理(NLP)下遊任務中,例如情感分析,主題標記,自動問答和對話行為分類,文本分類(給文本指定某一預定義標籤的過程)是一項意義重大且十分必要的任務。此外,這類方法通常不考慮文本數據中的自然順序結構或上下文信息,這使得模型很難具備學習單詞之間語義信息的能力。2010年代之後,文本分類已逐漸從淺層學習模型轉變為深度學習模型。與基於淺層學習的方法相比,深度學習方法避免了人工設計規則和特徵,可以自動從文本中挖掘出大量且豐富的語義表示。因此,大多數文本分類研究工作都是基於數據驅動且計算複雜度較高的DNNs來進行的。
  • BERT-Flow | 文本語義表示新SOTA
    來自字節跳動和CMU的 EMNLP2020工作深入分析了BERT向量,並扔給你一個SOTA模型針對這個問題,作者首先分析了BERT句向量分布的性質,然後利用標準化流無監督地將BERT句向量的分布變換成更規整的高斯分布,實驗結果表明作者提出的BERT-flow在多項任務上取得了SOTA表現。
  • 樸素貝葉斯詳解及中文輿情分析(附代碼實踐)
    內容包括:1.樸素貝葉斯數學原理知識2.naive_bayes用法及簡單案例3.中文文本數據集預處理4.樸素貝葉斯中文文本輿情分析本篇文章為基礎性文章,同時,推薦大家閱讀我以前的文章了解基礎知識。▌一.
  • 數據分析秘籍在這裡:Kaggle 六大比賽最全面解析(上)
    在我自學機器學習的前幾個月,對如何理解數據並沒有很多的想法。我假設數據來自一個自底向上組織完好的包,或者至少有一組明確的步驟可以遵循。查看別人的代碼之後,我發現大家理解、可視化和分析相同數據集的方式是不同的,對此我很震驚。我決定通讀幾種不同的數據分析方式,找出其中的異同點,並提煉出一套理解數據集的最佳實踐或策略,以便更好地利用它們進行數據分析。
  • 薄案庭審詞頻與邏輯分析:約8種詞表示記憶模糊
    庭審記錄相關詞頻  為進一步分析「文字+長微博」類微博,將5天庭審記錄合輯成149888字數的文本後進行詞頻分析 ,切詞後共得到5774個詞性不同的詞,詞頻總數為98626個。現按照庭審人物身份及詞彙相關詞性進行降序排列,生成下列詞頻表(表1)。
  • 多了一根的大胸美女:變性人的可笑可悲銀幕史-虎嗅網
    拉維恩·考克斯,因為出演《女子監獄》中的索菲亞一角,成為了史上第一個以公開變性人身份獲得艾美獎提名的演員。人們看到變性人的反應幾乎就像是被「訓練」出來的一樣,他們一出場,便伴隨著背景裡熟悉的「罐頭笑聲」。
  • 專欄| NLP概述和文本自動分類算法詳解
    序列到類別的例子包括文本分類和情感分析。類別(對象)到序列的例子包括文本生成和形象描述。 2. 文章分類:依據預設分類體系對文本進行自動歸類。 情感分析:準確分析用戶透過文本表達出的情感傾向。 文章主題模型:抽取出文章的隱含主題。 為了實現這些頂層應用,達觀數據掌握從詞語短串分析個層面的分析技術,開發了包括中文分詞、專名識別、語義分析和詞串分析等模塊。
  • 數據挖掘之文本分類技術,最詳細的原理解讀
    提取詞幹:對於英文單詞來講,經常會因為加了前綴或後綴而產生多種不同的形式,但是它們的含義往往是相似的。例如:英文單詞「protecting」,「protected」,「protects」和「protection」,對它們進行詞幹化處理後,得到其詞幹為「protect」。對於詞幹提取操作,其過程在於將單詞還原為其基本形式,而只保留詞幹。
  • 變性人明星原來不只有金星,盤點明星變性人
    娛樂圈中,變性人明星原來不只有金星,盤點明星變性人在娛樂圈中,金星是一個話題人物,不僅僅是因為她的毒舌性格,更因她的身份故事,她是一個變性人。
  • 大家覺得詞根詞綴的方法記單詞靠譜嗎?
    英語單詞構成有其規律,很好的掌握了構詞規律,才可以很好、很快的、準確的記憶單詞。英語單詞構詞法的核心部分,在於詞根,詞的意義主要是由組成單詞的詞根體現出來的。詞根可以單獨構成詞,也可以彼此組合成詞,通過前綴後綴來改變單詞的詞性和意義。(詞根和詞綴叫構詞語素)也就是說,單詞一般由三部分組成:詞根、前綴和後綴。詞根決定單詞意思,前綴改變單詞詞義,後綴決定單詞詞性。
  • 「學在前景」夢想如光 文本給我力量
    學在前景夢想如光 文本給我力量時間的腳步總是那麼匆匆,不曾停息。但是,時間對每個人都是公平的,利用時間,便收穫時間。每日點滴的努力,終將會有一定的收穫。孩子們從不會到會,從昨天的不熟練到今天的熟練,看到越來越棒的表現本身就是一種成長!