數字解析

數字解析專欄:出版社有書名的偏好嗎?(三)

離這系列的上一次專欄竟然已經過去 11 個月又 10 天了! 雖然一直想要脫離比較簡單的敘述統計,進入一些更進階的自然語言處理 (NLP) 領域(像是文字生成),但想著想著就懶了,也一直沒設計一套完整的流程。 原本打算把書名轉成向量,去看各出版社在二維空間中的書名分布,但今天工作到一半突然想到一個新的切入點! 不如, 來看看電腦模型能不能正確區分出不同出版社的書 好了!...
部落格分類: 
自訂標籤: 

數字解析專欄:又是狗屎……嗎?

這篇應該是我目前為止寫過最歪的專欄了…… 內有不雅字眼, 介意的同學請自行左轉, 感謝。 這個月的 WRN 數字解析專欄要來看一個言小之謎! 這個主題的研究動機來自於批踢踢言小板歷年來的諸多討論: 在提到黑潔明-小肥肥的猛男日記系列時, 言小板常會出現用詞的討論,不乏「一堆狗屎看得出戲」、「我都在腦中自動轉成 Shit」之類的推文, 有看這系列的同學們可能或多或少也注意過, 那麼「...
部落格分類: 
自訂標籤: 

數字解析專欄:出版社有書名的偏好嗎?(二)

沒想到這麼快三個月就過去了!富奸了這麼久,終於要來繼續進行書名的分析啦! 先稍微幫我自己複習一下上次我寫了些什麼:上一次我對書名作了一些最簡單的前處理之後作了敘述統計, 找重複出現三、四次的書名 以及 計算常見職業出現次數 。 這樣一列才發現我上次寫的知識密度有夠低哈哈哈哈哈 這次則是要開始對書名進行自然語言處理了,但是因為我最近有點忙,只好先抓喵喵屋來做個比較小型的研究……而且只有一半(...
部落格分類: 
自訂標籤: 

數字解析專欄:出版社有書名的偏好嗎?(一)

這次的專欄來研究我躍躍欲試的言情小說書名統計 + 分析! 不過做任何研究總是有個動機,而這次的動機源自於我跟我朋友某一次的對話: 一說之下才發現禾馬原來這麼不常出現總裁啊!!!! (抱歉,我私下是個熱愛使用注音文的人,請擔待XDDDD) 加上前一陣子批踢踢又吵了一下出版社的命名邏輯 (?),名字這麼重要不抓來研究一下真的說不過去! 要記好名字不要被湯婆婆偷走! 除了動機之外,這次的題目可以進行...
部落格分類: 
自訂標籤: 

數字解析專欄:藍海裡面有什麼?

數字解析系列專欄的第二篇就在大年初六開工日登場啦~ 這次要來探討的是新月出版社藍海書系的文案,雖然是數字解析專欄,但這篇比較接近「文字解析」,用數字告訴大家藍海書系的文案都寫了些什麼。 只能說人在逃避工作的時候潛能真的無限啊!(眺望遠方) 這次的研究動機很直白:有看內曼的同學們應該知道,藍海書系以穿越重生古代稿聞名,所以想來研究看看,究~竟~藍海系列的文案裡有多少穿越重生。 且待我們繼續看~下~...
部落格分類: 
自訂標籤: 

數字解析專欄:言情小說越寫越長了嗎?

我在 WRN 的第一篇專欄,來研究一件近期很好奇的事情。 這個故事得要從很久很久以前(?)開始說起: 我(可能也有 WRN 的同學跟我一樣)是個買書之後就常常把書放進書櫃擺到天荒地老都沒拿出來閱讀的人。最近要搬家想要清掉一批書,要清書勢必得先看書,於是只得卯起來讀,好巧不巧我選到的是 梁心 的書,讀到後來內心充斥著這樣的崩潰聲音:媽啊為什麼排版這麼密集、字這麼多、怎麼讀都讀不完~...
部落格分類: 
自訂標籤: 
訂閱 RSS - 數字解析