寫給新入大數據專業的同學的壹點點建議

#高考志願指南針#

這裏所說的新入坑,指的是相關專業大一學生。大三大四考生請忽略本文。另外,本文只是一個方向的引導,並不是什麼雄氏老方六味壯骨茶,並不能藥到病除,因爲這不是藥,只是一個思路和策略。它需要你去實踐踐行,而只有踐行,才能看到最後的收益。而這本身就是一件費力不討好,而且在很長時間內看不到效果,即使有效果,也不是直接的,也是間接的一件漫長的事情。

以下是正文。

本文旨在指導沒有經驗的想從事此行業的人及剛進入此專業的大一學生,幫助他們在界定研究問題、蒐集信息、分析信息以及準備報告時能從繁瑣的程序和步驟中找到清晰的思路,並清醒且較爲全面的認知到大數據的方方面面,從整體上建立起一個最基本、最基礎的輪廓和框架。

關於大數據研究中所涉及到的其他各專業的專業的相關知識所涉及到的各學科的研究方法已有大量書籍出版。本文旨在介紹大數據研究中可能及大概率會出現的具有代表性的行業問題。由於文中內容並非針對或適合所有讀者,建議讀者有選擇性地閱讀。雖然各類研究的流程都較爲圃定且相似,但讀者應儘量結合實際工作來學習或瞭解這些基礎性的內容。本文的目的不是幫助讀者成專業的“方法論學者”,而是使讀者瞭解最基礎性的內容。

本文介紹了幾種進入門檻很低但精通難度非常大的方法或者說入門到精通這個過程中必須經歷的若干技能和若干大數據研究中的應用案例,但由於許多內容需要大量篇幅才能介紹清楚,本文沒有辦法做更爲詳盡的介紹……本書沒有涵蓋所有大數據分析和研究方法,因爲有些方法的專業性很強,難以在有限的篇幅裏詳細介紹。如要掌握照片與圖像判讀和信號分析方法,需要數月的學習;要掌握網絡安全技術,則需要強大且穩定的計算機基礎知識;要進行人物畫像,必須瞭解和學習甚至完整的掌握生物學、生理學、行爲學、解剖學。

大數據及其研究的終極目的

大數據實質上是經過評估的信息,目的是幫助決策者和計劃者做出正確的決定。在很大程度上,經過研究得到的結論講義用於制訂(於國家而言,是國家和國際層面的;與公司而言,則是眼前和將來的發展方向與規劃)戰略計劃,通常是長期性的行動。戰略計劃涉及各類行動,它既可針對現存的問題,也可針對預期問題或假設的問題和情況,後者被稱作應急計劃。

與制訂其他計劃一樣,制訂戰略計劃需要依據信息。不同的是,制訂戰列規劃所需的信息常常無法獲得。因爲所有人都會想盡辦法隱藏、限制或歪曲對方想要獲得的各類信息和資料。所以,戰略計劃制訂者不僅要像大多數計劃制訂者那樣蒐集和利用信息,還要想方設法獲得對方有意隱藏的信息。這種有意隱藏信息的行爲使得大數據研究機構有存在的必要。

因爲一旦什麼信息都是公開且透明的話,就不需要大數據研究機構的存在了,此外,這種隱藏信息的行爲決定了大數研究機構的工作性質。例如,大數據研究機構必須使用各種方法和工具(包括精密的傳感器和觀察人員)來蒐集信息,而且要花大量時間和精力來評估信息質量。因爲只有保證原始信息可靠,才能做出正確的評估或預測——此類機構的主要任務之一就是確保信息可靠。

再者,這種隱藏信息的行爲也決定了機構需要在無法獲得事實時進行推斷。針對大多數大數據信息分析或研究項目,機構都會提出系統、可信的推斷,然後驗證推斷,並逐步用可靠的推斷(理想的情況是事實)來替代不切實際的推斷和猜測。正是這一點使情報研究區分於其他信息蒐集活動,這一點是大數據研究的基本要義。

大數據的辯證邏輯本質

對自身的行爲動作、操作性工作下的對除自己之外自身所處的環境中的所有人、事、物的觀察,並在這個期間尋找存在於事、物、人表象之下的在多次、反覆、往返測試和驗證下常態化、高頻率、大概率、穩定(必定會出現)出現的某種不受人爲干預、影響不因人爲意志的喜好厭惡而改變,也沒有所謂對錯和好壞、是非之分自然存在、出現、客觀發生及進行的某一現象。

大數據解析這份工作或這件事類似於微積分方程

具體情況如下:

大大數據就是在上述要素中,按照一定的邏輯關係和互相作用互相敢於互相影響並引之產生的產物,形成了你最終眼睛可看到的結果。

而給這些要素羅列其組成關係、邏輯關係、數值比例關係的事,就被媒體鼓吹爲神聖且高貴的所謂的建模。

而言之爲大數據解析或大數據分析,就是將這些內容進行拆卸和分解,做因式分解,並將這些要是注意分離、研究。同時弄出它們彼此之間的聯繫。

簡單說,一個是正向的,一個是逆向的——數據建模,正向;大數據研究,逆向(你可以理解爲逆向工程)。


實物                                   抽象                                代數方程

實際人、事、物         規律提取總結                    建立大數據模型

爲了簡化,憑空憑“  ”進行權重分配並寫入到數學模型中


殊途同歸的一件事

從事大數據相關工作,最後無一例外,都會指向 international relation、Military、diplomacy、Politics。而這些內容,將明裏、暗裏、直接、間接的影響着各行各業,包括你目前和將來能接觸到的大數據的內容或所涉及的相關領域:大到國家出臺的行業政策級法律條款、明文規定、不成文的慣例,中到企業的生存發展的環境、機遇、空間、輿論導向、投資方向、發展方向、炒作熱點、大宗商品的物價——這是企業的基礎生產原料、生產經營成本(物料、能源、人力),小到個人用於工作、學習、生活(的各項社會基礎設施,又稱基建,如交通和物流,通訊網絡等)、炫富、顯擺(自己獨特品味,發朋友圈和社交平臺的動態)所需要有的工資收入、就業、生活物價、房價、還貸及消費水平、旅遊、教育、醫療、炫耀出國遊的基本安全保障。

而這些內容,無一例外都是大數據。

雖然有一說一的事情是,哪怕你做好商業大數據解析也是一件很值得尊敬和不容易的事情,但是,和那四項(internationalrelation、Military、diplomacy、Politics)相比,其體量還是相對有限,並且,展開的視角也相對淺薄,捋事的思路,也被牢牢的束縛在了一個相對小的空間裏,看的還是不夠高。而這,無可避免的會牽連到對於大數據的簡析、解析的結果上,並直接導致面對同一件事情的時候,因爲氣度和眼界加思路相對狹窄的原因,將產生天壤之別的結果,一個還仍有無限可能,甚至魚躍龍門,發生了質量突變,一個則到此爲止,並且還有可能導致嚴重的判斷錯誤——不清方向,整個方向全錯了。

如果用在規劃和投資決策上,這意味着什麼,就不做解釋了。

這種天上地下的差距,不是考什麼試拿什麼證上什麼課學什麼費氪什麼金就能彌補的了的。喫再多的課,氪再多的金,這種差距還是無法彌補,中間的溝壑,依舊是無法填平的。認爲嗑課喫金就能改善,那只是一種錯誤認知。

如何才能跨過這一橫溝,彌補這一盲區?

當能做到,就不會有這樣的疑問了。懂了無需解釋,不懂,再怎麼解釋教學,也很難懂。因爲這本身就是一個無解的說難也不難說簡單也不簡單的門檻。你說她這個門檻大吧,確實很大,如同天塹,可是你說她這個門檻小吧,她也很小,一腳就邁過去了。這就和修煉是一回事。只要火候到了,自然就熟了。而這,又涉及到道之道了——道可道,非常道。修道,分爲兩種。其一,頓悟,其二,漸悟。雖然該領域的學界,一直對南頓北漸有如同字面意思上的學術分歧,但從得道這件事上來說,它就是殊途同歸。不管過程如何,結果最後是一樣的。而這就夠了。從辯證的角度來說,頓悟在某種程度而言是建立在漸悟的基礎上的,因此應該是沒有誰好誰低這一說。

除此之外,南頓北漸的過程也都一樣,都不容易。說不容易,是因爲,這注定是一個相對漫長的過程,也註定會遇到很多問題,並且毫無疑問,肯定會有大把大把的人,無法堅持下去最後選擇放棄,同時因爲選擇了放棄,所有之前的努力全部都白做了。

當然,如果真的是這樣。也就不能怪,爲什麼自己永遠看不到出頭之日。永遠找不到方向,自己爲什麼永遠都跟不上、比不過、做不到行業內小有名氣的人(那樣的水準)。

這真的不能怪任何人。

 大數據和數學的關係

函數是客觀事物的內部聯繫在數量方面反映,利用函數關係(所謂函數關係就是

變量之間的依賴關係)又可以對客觀事物的規律性進行研究。

因此,如何尋求出數關係,在實踐中具有重要意義。在許多問題中,往往不能直接找出所需要的函數關係,但是根據問題所提出的情況,有時可列出含有要找的函數及其導數的關係這樣的關係式,就是微分方程。

當微分方程建立以後,對它進行研究,找出未知函數來,這就是解微分方程。

初等數學的研究對象基本是不變的量,高等數學的研究對象則是變動的量。

不變的量和變動的量混合在一起,就是微積分。

做大數據研究,它研究的就是動量和定量的數值關係,找到它們之間彼此存在的邏輯關係,發現存在於其中的大概率、常態化發生的事件和原因及規律。根據人的需求來引導這些規律發生或使用這些規律,這就是大數據應用;研究這些規律,就是大數據研究的數學本質。

它絕對不是說跑幾個程序,擼幾串代碼就能了事的。要真的是這樣,人人都是數據分析師,人人都是數據微操大師,但事實好像並非如此,儘管這個客觀事實這會讓人很不舒服。

看看就好

看看就好

涉及商業大數據的一點點心理學內容

如果一個商品的購買、獲得(擁有)的先決條件變得過於簡單、沒有不可比擬的挑戰性、獲得的過程不夠刺激、心理的需求太過容易得到滿足即太容易獲得,因爲獲得這個物品而經歷過的來之不易的那種心理上的高人一等的情感也不復存在。

一旦這種心理需求不復存在或其能產生的信號刺激強度,無法滿足當事人的心理需求閥值,那麼,這份商品對於當事人的購買慾望,並不會強烈,尤其是非生活物資類及非生存生活工作學習所必須的物資。

所有這些情感是真實存在於消費這種行爲中的,它並不會因爲無聊的繁瑣的所謂的智能算法沒有將其考慮進去而消失,它一直在那。

這些內容會嚴重影響到個人的消費行爲和習慣,但是,但是,但是,商業大數據模型,基本就沒有這一塊的事,即使有,也是簡單和粗暴的將它設定爲一個所謂的固定的或在某個活動區間的數值。僅僅是單純的數值,僅此而已。

而這,就是Bug。


請端正好的你的心態


莫怪世事艱,更怨技弱零。

若心傾於藝,怎慨履步困。

雜心既浮塵,思智混沌態。

仕事不如意,轉求證分來。

行徑不走心,惟求快更蓋。

名聲裹體成,好日盡方來。



不思技藝幾成熟,卻慮金銀載幾車。

仰望長天仕是事,更恨食侍令人憂。

忽遇風捲殘雲勢,含恨落淚吞辭令。

望眼欲穿空洞腦,雙手空空無記憶。


白紙打試樣

筆修定成向

蠟泥鑄造身

祕滷煮水成

噴砂烤烘漆

3d硬金成

詡比真金精

吾輩皆英傑

無能受外壓

事食難辨識

精神百般熬

不責己乏力

確譴待不公

司值欺我甚

分遣髒累差

勿責不盡力

吾非不出功

不爲摸魚混

事理太複雜

實屬壓力大

吾乃金嚶佛

怎可受此辱

意欲坐蓮臺

香延火續綿

天上人間美

笑逐盡開顏


擲金萬兩有所期

揮筆刷題終究犀

不取深研造技藝

冥求福身裹聖衣(袍服)


這是一條註定會不簡單的路,不要指望一鍵9999999,也不要指望一鍵一勞永逸。

以上內容是作爲一個尚未步入學校還未成爲大數據相關專業的學生的你,應該要知道的幾件非常基礎性的事情。下文的內容,則是對於一個已經是此專業的你,應該要了解的內容。特此說明。


一些最基礎性的建議或意見

首先,不管你當前的專業,你自己感覺是顯得有多麼冷,多麼坑,都不要抱怨,請按照學校的課程設計還有老師的要求來。部不論學校的課程設計和安排在你的認知理解範圍內,感覺有多麼扭曲。請,或者說,強烈建議,認真對待學校安排的還有你的授課老師,絕對不可以消極面對。

然後,試着開始重視下面幾件事。

1.試着使用a4紙,寫出字行成直線的文字或文章,而不是在沒有了格子以後,字與字,就成了一條斜線。

2.試着將你寫字的速度和打字的速度,儘可能提升起來。儘可能的無限接近打字每分鐘88字(一來是圖個吉利,八八等於發發,二來是這種打字速度是非常快的了。當然,前提是,別出錯)。

3.試着將你閱讀文字(包括紙質圖書和電子圖書)的速度提起來,後面你就會知道,如果做不到,你會有多麼痛苦。標準麼?一本小說,大博弈,周梅森老師寫的,這本小說,電子版,一天,或者半天就能讀完(當然不是24小時,實際只需要5-8小時就能讀完,並且讀書筆記、重點段落就能順手提出來)。以這個標準作爲你的閱讀速度的最低或者入門標準。如果發現很困難,試着克服,試着做到。雖然這事非常難,也在你作爲大一新生看來,幾乎沒啥意義,但介於是大數據相關專業的你,這事和你的精神健康、身體健康、心理健康息息相關。如若不然,真的,後面有好果汁等着你,這些原味果珍,會讓你痛不欲生的。與其這樣,不如在大一、大二相對閒暇之際,將這塊的頑疾克服掉。

在做完或者在訓練自己做好上面這幾項以後,請努力試着抽出時間,完成下面圖書的閱讀。這些圖書雖然不是什麼神書,也不是什麼暢銷書,但請相信也請試着耐心的將它們讀完。這些圖書可以購買紙版,也可以找到電子版。這些書基本都有電子版,是可以買到的。


情報研究方法論

這本書,其他的書你可以不讀,但是這本請無論如何都要將它讀完。某種意義上來說,這本書的地位相當於圈子內的馬哲。

還有一件事,本書的作者,是圈子內絕對有重要級影響力的老爺子。如果你是想從事大數據行業,就不可能、也沒有理由不知道這位作者。如果你連這位作者的書都覺得不足以成爲你的書櫃上的乾貨,臥槽,那就沒有什麼東西可以稱之爲乾貨了。


情報與反情報叢書18冊

1.《戰略情報:爲美國世界政策服務》

2.《無聲的戰爭》

3.《情報分析:以目標爲中心的方法》

4.《情報:從祕密到政策》

5.《情報分析心理學》

6.《情報蒐集技術》

7.《戰略情報的批判性思維》

8.《情報研究與入門分析》

9.《情報分析:結構化分析方法》

10.《情報分析案例:結構化分析方法的應用》

11.《情報分析案列·實操版:結構化分析方法的應用》

12.《分析情報:國家安全從業者視角》

13.《戰略情報:情報人員、管理者和用戶手冊》

14.《情報分析:複雜環境下的思維方式》

15.《情報蒐集的五大科目》

16.《情報蒐集:技術、方法與思維》

17.《情報欺騙:反欺騙與反情報》

18.《以目標爲中心的網絡建模:複雜情報分析案例研究》

國家安全與情報叢書6冊

1.《戰略欺騙》

2.《中國古代情報史》

3.《中西情報思想史》

4.《情報分析案例選》

5.《情報分析方法論》

6.《孫子兵法情報思想研究》

國家安全戰略研究叢書5冊

1.《危中求安》

2.《反恐原理》

3.《鎖定真相》

4.《國美國家安全局報告》

5.《美國國家安全局事件》

國家安全譯叢10冊

1.《情報術》

2.《騙中騙》

3.《全民監控》

4.《誰來監管泄密者?》

5.《數據與監控:信息安全的隱形之戰》

6.《21世紀犯罪情報:公共安全從業者指南》

7.《祕密情報與公共政策:保密、民主和政策》

8.《網絡戰:信息空間攻防歷史、案例與未來》

9.《恐怖主義如何終結:恐怖活動的衰退與消亡》

10.《國家安全與情報政策研究:美國安全體系的起源、思維和架構》


國家安全與情報叢書、情報與反情報叢書、國家安全譯叢,它們分別各自是一套,且每一套實體書買起來並不便宜,但在G胖那少花點錢,也就都能提回家了。有錢買使命召喚和戰地,又或者動不動年卡魔獸世界,或者EVE,還預購一些3A,怎麼可能沒錢買這書?

 

大學生競爭情報意識與技能培養

這是一本不論是否爲本專業的學生都可以看的那種純純的妥妥的入門級圖書,你姑且可以看成是科普圖書。


除了上面這些必看的書以外,還有一些簡單的入門的課程。這些課程分爲免費和收費。

免費的課程清單如下:

2022 春 文獻管理與信息分析 直播班鏈接 - 知乎 https://zhuanlan.zhihu.com/p/473177842?utm_id=0

這是一個簡單的不能再簡單了的基礎課程。閒暇之餘,可以補補。它不要錢。

【【喬治華盛頓大學】情報與戰略-中英字幕可自選-嗶哩嗶哩】 https://b23.tv/Do7RYY8

【【北達科他大學】情報分析技能-中英字幕可自選-嗶哩嗶哩】 https://b23.tv/4PyYXtD

【Farmsec 農夫安全第六季公開課——情報分析-嗶哩嗶哩】https://b23.tv/99UQLt6

 收費的課程清單如下:

江無情:福爾摩斯的推理筆記

https://www.bilibili.com/cheese/play/ss376?csource=common_hp_favorite_null&spm_id_from=333.999.0.0

重視數學

數學的思維邏輯

大數據的數學邏輯

實物——抽象——代數

實物,指可觸及可見的事物,也就是大數據的研究對象,又叫數據樣本或數據源;抽象,指抽象化的使用語言文字字符符號指代和代替的數字(這些玩意將會被規劃到所謂的數據模型中去,特別是純商業數據模型,特別是純商業數據模型);代數,指更爲模糊和抽象的用於指代數字的代數符號。

大數據(收集和解析)的流程是,從無意識到有意識(無意中發現到開始重視和在意),從雜亂到邏輯(偶然事件到低概率發生事件再到高概率發生事件),從抽象的泛泛而談到準確性概率的測量確定及規範化、標準化、流程化的建立(從高概率發生到穩定出現和發生直至成爲一種常態)。

大數據的數學陷阱

大數據到了最後特別是具體的商業大數據的應用,都會被簡化爲純數字字符符號,這樣能簡化大數據作業的工作量也能在一定程度內提升工作效率。但也會增加出問題顯Bug的概率。

因爲商業大數據的實踐應用,圖窮見匕的說,就是爲了做更精準的商業廣告,賣更多的產品和服務,這是它唯一的目的。說簡單一點,就是賣東西。從物理實物到用於精神、精神、心理活動滿足與快感的服務,而促使用戶花錢購買這些內容的原因或者說動機/驅使,則是商業大數據的研究核芯內容。

營銷和策劃組全指望着這養家餬口,而各公司招募的大數據從業人員,則會將他們認爲的導致併產生用戶消費行爲的動機及一切消費成因、消費習性,以第一認知的角度去進行摸排確定並將它們覺得正確的內容(成因)捏成一個動態數據模型。這些數據模型就行業內鼓吹的用戶分析模型,這種模型的建立過程,又稱爲大數據精準化商業建模。

而這些商業模式,其實質就是微積分方程(關於這個後面有詳細的簡單介紹)。但是,由於能影響到用戶行爲的因素太多了,爲了簡化模型的複雜程度以滿足微操大師、常凱申附體併合爲一體的生理、心理需求,便有了將他們任務不重要但確是非常重要的內容的移除和不考慮或減輕權重的簡化版的數據模型及換了皮膚的其他類似模型。但是,由於這些內容是憑藉它們認知給造出來的,所以註定是會有模型缺陷甚至根本就是一個錯誤,而這些錯誤因爲一些原因,暫時性的是看不到的,待到環境發生改變,誘發了這個隱藏的Bug帶來的錯誤,一切都將無法挽回。

當看到嚴重的Bug之後,想挽救,基本是不可能的了。因爲很多事情甚至一個龐大的項目體(涉及幾百人或者更多的項目)都是就這個錯誤的Bug構成的數據模型建立的。這個時候,只有兩條路,要麼,修Bug(一般是拼死挽回,各種改革什麼的),在原來的shi山上繼續前進;要麼,直接放棄,全部推倒重來,重新來一個新的。

雖然如此,但這一個新的模型,還是沿用的所謂的專業的思想和思路建立的,依舊是沒有從本質上意識和發現到問題的嚴重性錯誤所在(因爲相對的偏見和狹隘加淺薄的認知區域,導致其認爲自己永遠或者大概率是對的,不允許被質疑的、這就是所謂的專業人士的專業水平。但實際上是錯得離譜),所以,這新模型,她就是一個Bug2.0、3.0。到了時候,她改出問題還是得出問題,是一件理所當然的事情。而每每到了這種時候,就會把出問題的鍋丟給市場環境問題——什麼市場寒冬啊,什麼消費結構和消費需求改變啊,什麼市場競爭太激烈啊,而並沒有回到自己本身的問題上來——那個根深蒂固、頑劣且堅定的認爲自己是對的、永遠無法消除的錯誤認知。不過,另一方面,當這種事情出現的時候,也基本表示了另外一件事,那就是喜聞樂見的裁員,或者減薪——並自圓其說的美其名曰爲戰略調整、壯士 、斷臂求生。

口可口可。

這裏所說的認知,指的是:基於對於用戶行爲特徵、用戶需求動機構成進行( )商·業( )大數據分析後,組建的以某種模型(這些類模型往往會智慧的簡化很多要素並忽視其存在,因爲不好做數模,變量太多了,完全不可控,不符合所謂的模式建造邏輯和必須的規矩,更重要的是領導也不喜歡。而這些內容,纔是最重要的,是最終影響這個項目的規劃和發展方向甚至是壽命的關鍵性和決定性因素)爲主導和指導思想、精神的商業新項目的創立、開發、產品的開發、市場策劃規劃、戰略佈局或戰略規劃、市場營銷。

因爲錯的離譜,所以發病以至於裁員散貨,天經地義。  不除,天必咩之。

如何才能擺脫這種錯誤陷阱?

無解。唯一的解法就是,儘可能的掌握更多的各門類專業知識。

 

要不要關注或者加入大數據研究或討論的星球、公衆號?

完全沒有這個必要,純粹是浪費時間和精力。所有這些,最後都變成了標準的模板和公式化,而這些都是基於一些最基本的理論而不斷的換皮的產物。一個天大的笑話是,那些賣課和上課的,甚至無法說出情報、競爭情報、開源情報、大數據、人工智能、(工業)物聯網、互聯網、元宇宙的區別和演化發展歷史。即使有,也基本都是含糊不清,保證你上頭:大概率是譯製片文學的水平。而因爲搞不清,所以,很多事情搞不定。連電子管都說不清楚,滿腦子就想着二極管、三極管——二極管、三極管都不能甚解,開口閉口集成塊——集成塊都沒研究清楚,動不動就集成電路——集成電路一知半解,就敢上單片機編程。

而所謂情報研究或具體應用,實際有些策略和思想方法,你可以驚喜的在考古學的相關著作、論文、教材、圖書中找到,並且會非常好用,可以說是拿來就用。

除非你也不想縷清自己的思緒和邏輯,上來就要搜刮被冠名爲乾貨的模板,並且將這視爲唯一,並在各類乾貨模板上左右反覆橫跳,從此再無它。


有沒有必要閱讀一些被冠以乾貨的文章或者花錢學習被吹的上了天的課程?

可以,在確保自己能跟得上學校的正常進度、能逐步完成前面所說的三項技藝這一前提下,輕微涉足,是可以的。

因爲是文章,體量不會太大,在能保證高速閱讀的前提下,所以它們的閱讀並不會佔用太多時間。如果沒有快速閱讀這一技藝,建議少看少讀,因爲那是無底洞。

如果是花錢不多的微課程,是可以初經人事的試試,但別太當回事,一切以學校爲主。

關於這些課程,無法評價,因爲這裏沒有相關經歷,無法做出評價。但介於都是從本科生教材扣出來然後套上皮膚這一基本原型來說,其作用非常有限。並且,如果將此類物視爲經典,那麼,大數據之路作爲職業,這路會變得越來越窄,路也很難說走的長。

有沒有必要做rrs推算和訂閱?

可以,因爲這本身就是大數據的一個很小的分支。雖然個人並沒有相關的經驗和實操經歷,但有一點可以肯定,這rrs需要當事人瞭解軟件基本運行規則,即編程。其次,需要給訂閱的內容上標籤,寫規則。這就是時下被扯的上了天都半成神了的算法的最基本邏輯。在這個意義上,當事人或多或少可以親身體歷到,當算法中的某些規則變了,包括取樣對象和過濾規則,你拿到的結果就完全不一樣了。而用戶想看到的,和用戶實際最後看到的,是不是一回事,就取決於算法了。由此就又不得不扯到另外一件事,那就是模糊算法。因爲一旦太精準了,覺得自己很高貴的用戶會發現自己的隱私被窺竊了。所以,只能給出用戶一個很大的範圍,不然就會有天大的麻煩。

說來也怪——如果是一個人,通過觀察某人的朋友圈、各類社交平臺的動態來還原該人的性格、信仰、興趣、愛好,那就是變泰,就是惡棍,就是心理不健康,就要拉黑,而如果是其所在的平臺,根據這些來推送廣告,甚至推銷電話那就是理所當然的。這算不算怪哉言論和荒謬的思路?你敢讓這樣的用戶擔當某個重要的決策崗位嗎?敢,有什麼不敢的,專業對口……好,很好,非常好,特別特別好!

 

請務必學會逐步拋棄乾貨這個概念

大概起,這話說出來會讓大一學生感覺到很困惑。不看乾貨看什麼?

首先,這乾貨是他人認爲的,不是你認爲的,每個人的學識儲備、經歷、眼界決定了其認定爲乾貨的基本要求和標準是不一樣的。如果拿別人的標準來和自己套用,這……小馬過河,柯基游泳的故事,這個可有所耳聞?

小馬過河就不講了。對於柯基來說,水不要太深就可以讓自己的身體完全浸泡於水裏,就可以游泳。但對於德牧等大型犬來說,這水哪裏能游泳?只是剛好把爪爪打溼而已。

第二,乾貨這東西,很容易淪陷爲標準的模板,拿來就用,套不上就是樂色就應該丟掉,就應該被拋棄,這非常容易導致用者的一種依賴和依附思想,喪失自我的主觀能動性,變成一個木頭。這應該不是什麼好事吧?功德加一,還是給別人,這豈不是非常虧,更有種被侮辱的感覺不是。除非你就想這樣混日子,那麼就另說了。

第三,乾貨,因爲容易引發網絡流量,所以,保不齊會被塞進一些其他沒用的引流的廢話。如此一來,硬是被水泡了,這麼一來,它也不被資格叫做乾貨了。這樣,無底線追隨的意義也不大了。

第四,就算是被禁止傳播的色情小說和無聊的網絡小說,一樣能扒拉出有用的乾貨。只是這種內容所佔的比例在全文來說,不算太大。如果用戶沒有冷雪一般平靜的心智,這些內容都將淹沒在浩瀚的文字海里面。因爲其文字內容的特殊性指向,讀者怕是很難不被第一主觀印象的被帶偏,將閱讀的注意力放在了那些澀澀的事情和主題上了,冷靜的對待文字就幾乎不可能了。於是,找到並發現那些拋開澀情主題之外單論某種專業知識的內容的可能性,就無限的趨於零了。而這種狀態則是大概率事件,因此,對於普通用戶來說,那   和   小說,就自然不是乾貨了。

舉個例子, 國愛情  片的宣傳海報,本身也是乾貨滿滿。只要你稍微研究下,就能發現包括但不限於構圖、用光、服裝搭配、色彩搭配、字體字號、字體顏色、字間距、化妝等的實戰教學活體案例。

你可千萬別學成了這樣

第五,如果你的頭腦非常理智,而不是容易被他人影響和蠱惑,那麼,實際上,在你身處的任何地方,眼鏡所看耳朵所聽身體所觸的任何人、事、物,都有乾貨可以學習。當然,這對於大一的你來說,可能是一件不太容易理解的事情。但真實的情況確實就是這樣。處處都有大數據,只是因爲你暫時尚不具備或掌握相關的知識,因此無法在你接觸到的那一刻,敏銳的意識到它的存在。回到古老的典籍上來,三人行,必有我師焉。說的就是一個意思。


甲 “有介紹信嗎?”

乙 有。 

甲 “填個申請書吧!” 

乙 怎麼還得填申請書。 

甲 “對了,國有國法,家有家規,店有店章,住我們飯店一律要填,一式三份,用毛筆、鋼筆填寫,塗改無效。貼上一寸半身免冠照片。” 

乙 好嘛,比領護照還麻煩。 

甲 我接過申請書一看,密密麻麻兩大張,得填40多項。 

乙 都填什麼? 

甲 姓名、別名、曾用名,性別、籍貫、出生年月,家庭出身、本人成份,來市原因、何人介紹、大約需住幾天,是否帶有重要公函文件、圖紙、絕密 文件,裏頭寫的什麼…… 

乙 啊! 

甲 就甭填了。 

乙 我說的呢? 

甲 手提包中是否裝有現金支票、貴重的物品,如:金銀、首飾、自行車…… 

乙 這自行車能裝手提包裏嗎? 

甲 還有是否攜帶易燃、易爆、易腐蝕的危險品,如:汽油、火藥、硝酸、硫酸、鹽酸、香蕉水、桔子汁…… 

乙 桔子汁能算危險品嗎? 

甲 還有旅客進店帶有幾盒火柴、幾隻打火機,有爆竹沒有?幾個炮打燈?幾把二踢腳,幾串麻雷子,幾掛鞭,幾掛炮,幾盒滴滴金兒,幾包“耗子屢” ? 

乙 這張是什麼表? 

甲 客人安全調查表。 

乙 調查什麼內容? 

甲 姓名、別名、曾用名,性別、籍貫、出生年月,家庭出身、本人成份…… 

乙 還是那一套。 

甲 本人面貌、特徵,身高、體重、腰肥、身長,穿什麼衣服,臉上有無痣,身上有無疤?手指上幾個鬥幾個簸箕? 

乙 這許是通緝在逃犯哪! 

甲 本人何年何月何日來本市?有哪些活動?是突然病故?是由於車禍致死,還是自殺、被暗殺、兇殺?是抹脖子、上吊、投河、跳井、喝敵敵畏?… … 

甲 我一看這是客人健康調查表。 

乙 這填什麼內容? 

甲 姓名、別名、曾用名,性別、籍貫、出生年月、家庭出身、本人成份…… 

乙 又填一遍。 

甲 本人身體健康狀況:有無疾病,如何治療的?本人病史、家庭病史、三代 病史,是否得過大腦炎、腥紅熱、肺病、肝病、膽病、腸病、皮膚病、傳染病?有沒有高血壓、低血糖、重傷寒、血吸蟲、肪管炎、白癜風、腎結石、氣管炎、牛波癬、羊角瘋、半身不遂、產後失調、心肌梗死、骨質增 生?“O”抗是否正常?膽固醇是否偏高?轉氨酶是否下降?血色素是否增加?照過X光沒有?做過心電圖沒有?打過預防針沒有?種過牛痘沒有?住過醫院沒有?到過火葬場沒有? 

乙 沒有。 

甲 睡眼好不好,有何習慣?是偏着睡,仰着睡,側着睡,還是站着睡? 

乙 沒練過那功夫。 

甲 打不打呼?撒囈症不撒?說夢話不說?有沒有咬牙放屁巴嗒嘴的毛病? 

乙 這跟住店有什麼關係呀? 

甲 “有什麼關係?我們不管,我們既然分工管這個我們就要調查。快點填!照你這麼慢騰騰的,工作效率怎麼提高哇?” 

甲 後邊要填寫家庭經濟狀況、家庭人口,幾個弟兄、幾個姐妹、幾個小孩、幾個愛人? 

乙 什麼? 

甲 “對不起!表印錯了湊合填吧。” 

乙 不像話! 

甲 父母親由誰贍養?每月拿多少錢?拿錢時候你愛人愛人願不願意? 

乙 管得着嗎! 

甲 來店喫多少錢伙食標準?是八毛三的,是一元零四的,是一元二角七的, 是一元五毛九的?是喫勞喫素?是喫米喫麪?喜不喜歡包子、餃子、麪條、壓餎餎?一頓喫幾兩?喝酒不喝?愛喝白酒、色酒、啤酒、汽酒、麴酒還 是藥酒?酒後撒不撒酒瘋?是打人,是罵人?是哭、是笑、是說、是鬧? 來店準備喝幾回?打算鬧幾次?  

這是相聲,多層飯店的臺詞——這些繞口的內容,其實質就是大數據。你要否認嗎?


如果可以,請試着多寫點教程

一個完整且詳盡的教程,並不容易。首先,步驟要正確,流程要清晰。如果有文字敘述不清、表達不清,那麼,勢必會有誤解、疏漏和歧義、曲解。其次,你會做不代表你會說,你會說不代表你會用書面文字予以清晰的表達。什麼是清晰的表達?當你寫好後,呈給他人,他人看完,不會產生任何不解、不懂,並且一步一步按照你的文字來操作,期間沒有任何意外和bug及錯誤發生。即使有,你也在文字中給出了方案,照着做,就能順利解決。第三,在編寫的過程中,你會發現,平時言辭華麗、詞藻繽紛、妙語連珠的你,居然在使用書面文字的時候,語塞煎難,處處爲難。這事(寫教程)會讓你發現,口頭用語和書面用語,完全是兩碼事。你會驚呼,你都不好用口頭用語來書寫,特別是如果有平臺有徵稿獎勵獎金的時候,這樣文字造詣的文章,十有八九是要被系統落選的。但也無可厚非,如果你瀏覽了那些被系統選中的文章,你會發現,文字確實讀起來很舒服,再看看自己的,沒被選上,並不冤枉。

如果你並不介意這件事,那麼無話可說。如果你很在意這種事,並且很想時不時的撈一點小錢錢,給自己或者老婆大人(不是真老婆,是半老婆,也就是自己的女朋友)買點小禮物,並且可以很自豪的說,這是自己的稿費換來的(當你說出是用稿費換來的這話後,令夫人的那種發自內心的敬仰和尊敬、崇敬的心情,會溢於言表。你們兩人間的親密度,有概率因爲這種無形的技藝的原因,在那個瞬間,驟然提高很多很多),那麼這事你就得練筆了。

一開始,怎麼方便怎麼來,就用你最熟悉的口頭用語來寫各種文字,主題可以是隨意的,總而言之一句話,用你可以書寫和表達的筆墨去書寫你想記錄或你需要表達的意思和內容。實際上,你可以從最簡單的打字聊天開始。詞彙不夠咋辦?多看看經典電視劇,然後試着將它們的臺詞背下來,或者多看看彈幕,覺得不錯的就暫停,然後將彈幕抄下來,多抄多寫多記多背,然後不斷的總結和琢磨,逐漸形成自己的文體。當詞彙積累的多了,寫的多了,就能寫出可以去賺稿費的文章了,至少概率提升了。而所有的這一切,還是和大數據專業的你,未來的生計有密切關係。

無論什麼內容的文章,想要獲得認可,包括轉發、推薦、點擊量、系統給予稿費,或者你寫的給客戶的報告或者企劃,又或者你的畢業論文,她們都有一個標準,那就是言辭鑿鑿,邏輯清晰,沒有多餘和無用的文字。而這,對於作者來說,就必須要有一個清晰的全盤構架了——要表達什麼內容,組成結構,各部分之間的關係,使用的描述性措辭,書面用語的選擇,意思和邏輯的表達並連貫,這些都要考慮到。想到哪就說到哪,沒有一個相對連貫和清晰的思路,可以,但這個文章大概率沒人看,因爲幾乎看不下去。如果是給客戶的文件又或者你的畢業論文的話,那麼結果是可想而知的。勿怪你領不到薪水和畢業證,勿怪對面發飆。如果你依舊不在意,那麼再退一萬步說,就算是聊天或者講故事,沒有這樣的一個潛在的基本邏輯,你的聽衆也會跑光的——除非你學馬洗澡,賣掛票。因爲確實聽不下去啊!(這是一個相聲,名字就叫賣掛票)。

做大數據解析,或者撰寫大數據解析調研、總結報告,需要嚴謹且清晰的邏輯思路做爲前提。思路混亂或者很模糊,是無法做出令你的客服滿意的產品的。勿怪客戶發飆,怕是連同事和領導都看不下去。寫幾個或編程就是大數據?這不是很奇怪的事情嗎?

或者再退兩萬步來說,你作爲大一的學生,等熬到大四,總歸是要寫論文的吧?有些時候,爲了一些原因,也是要投稿到各級期刊和雜誌的,於是,問題就來了。學生身份的你,想不想盡可能少的被導師打回重寫,想不想拒止編輯部的退稿郵件?想不想在你的同學都抓耳的時候,你卻相對淡定?再或者,在工作單位面對時不時就要來的各種公文函件的書寫要求,你也不想頭疼煩躁吧?

 tai  tai,你也不想      吧?

或者再退三萬步來說,你想不想在遇到任務的時候,很清晰且快速的就在腦中迅速生成解決方法,然後就可以壓着進度按照自己的喜好來故意暫緩或加速進度,並且還可以故意表現出壓力很大的一種狀態,讓你有理由摸魚划水?因爲在接到任務的那一個瞬間,就有了完整規劃,因此可以自由應對,輕鬆支配。

如果想避免這些麻煩事情發生在自己的身上,那就試着開始重視寫作這件事。不要覺得很煩,不過,如果真是這樣,上述那些麻煩將最終讓你自己精神備受折磨。該受得罪,最後還是得受,它是跑不掉。

當你能做到你的投稿五投四中或者三中,剩下幾次是因爲內容不符合錄用選項但文字本身沒有什麼問題,相信自己,上面的那些問題,基本對你來說不是什麼問題了。這裏說的投稿,指的是以遊研社爲代表的,有審覈編輯且對稿件內容要求很高的平臺的投稿。系統自動審覈的,並不能說明文章的好壞高低。


如果可以,請試着做一些圖書簡介或影視作品簡析的視頻並嘗試投稿

這樣做除了練筆之外,還有一個目的,那就是學會概括與歸納總結。點擊率高還有粉絲數量多的up主,之所以會有高額點擊量和衆多粉絲,不是沒有原因的。如果將點擊量很高的視頻用軟件扣下來,再用軟件將臺詞扣出來,整理成文檔,你會發現,其質量,和準論文沒有什麼區別。而且,不需要懷疑的事情是,這些視頻的文案,百分之百就是按照論文的格式來寫的,包括一級標題、二級標題、三級標題,最後還有備註和信用文獻出處。只不過這些文案,在視頻中是看不到的。

如果你想在大數據從業一事上有所建樹,或者不想被人耍猴任人騎,擁有相對獨立的主見和判斷力意識,那麼,對於事物的歸納和總結這一考試不考、文憑不賣的隱形技能,是必須要修煉的。只有這樣,你才能在繁雜的事理中快速的捋出頭緒。不過你可能會說,這和大數據有啥關係?

同學,關係可大了。

第一,大數據是啥,就是一眼望不到頭的數據和文件、資料,既然你從事的是大數據崗位,那麼,你每天面對海量,多的要你頭皮發麻的事和各類信息,是家常便飯。這是一件非常正常且普通無奇的事情。你必須要面對它們,因爲你的崗位就是做這個事的。如果要你從中找到有用的信息,縷清這些東東彼此之間的邏輯和聯繫,你自問,是不是非常需要縷清繁雜事物的思緒?如果和螞蟻搬家一樣,那就算是24小時加班,也幹不完。就算是用輔助程序,你也得寫好程序。而這程序,還是要靠你自己來寫,思路不清晰,那這程序只能起到debuff的效用,苦的是你自己,而不是別人。沒人能幫你。一切痛苦和折磨,還是要自己全部喫下。想靠術士的法術進行轉移?這不可能。

第二,大數據相關工作在清理完前期信息後,需要你根據上級的任務要求,捋出下一步的行動清單和流程,第一步至最後一步,每一個階段的詳細要求,要達到什麼結果,要取得什麼目的,如果推進中出現了意外有什麼補救措施,備選方案是什麼,而不出意外的話,所有這些是沒有任何人告訴你的,都需要你自己去解決,去捋順,想清楚。如果你做不到,大概率是被叱責的。雖然有老人帶新人一說,但不可能保證所有的老人會願意傾囊相授——這其中既涉及到教會徒弟餓死  ,也涉及到其人的語言表達是否能被你理解和明白。有些人不善言辭,也不擅長教授,只擅長親自實操。你不能責怪他不願教你。除此,還涉及到一羣混子,毛都不懂,只會口花花,技術?幾乎沒有,想從他那學到從業技術,概率不大。你說,從繁雜的事理中捋出思路和順序,是不是很重要?工作場上總會有人說這大那大,這不順那不順,但從來不認爲是自己沒有拎出頭緒和秩序而導致的。而一本書或者你的教材又或者一部影視作品,和繁雜的工作任務比起來,是不是簡單和單一了許多?既然早晚都要涉足解析事物一事,爲什麼不在大學事務相對沒有那麼繁雜的時候儘可能的將這活計學會了掌握了?

第三,就算你不從事大數據信息解析相關工作,其他行業的任意崗位都會存在同樣和類似的事務解析工況。不要以爲只有大數據崗位纔有這種事理,以爲只要不涉及就好。然而這想法是錯誤的。除非你想和那些這大那大的前輩們一樣重蹈覆轍,將ta們的痛苦也附魔到自己身上,再來一遍。


如果想走出你對本專業的迷惑,可以試着學習下推理技術

大數據的核心不是使用學校教的軟件和課程所涉內容,而是推理。推理這事,考試不考,老師不教,除非你是物證技術專業或者刑事偵查專業。不論你使用什麼技術或軟件,到了最後,還是需要使用到推理的相關邏輯。一步一步,最後找到既定的結果。癡迷軟件編程,沒有什麼錯,但它永遠只是一個輔助工具和道具,在使用任何軟件或者工具之前,需要確定清晰、準確的步驟和方案,否則,軟件使用的再溜,最後問題還是無解。

如何才能推理,如何才能進行推理?這是一個問題,但也不是問題。因爲問出這個問題,說明提問者還沒有建立起必要且充分的知識儲備,並且這些知識彼此之間也做不到很好和有效的聯動。這是一種技術儲備或知識儲備相對貧瘠的狀態。而噹噹事人掌握了數量一定的除計算機軟件使用技術及技巧之外的其他任意學科的專業知識以後(至少三門吧,深度就以相對來說簡單的不能再簡單的本科生教材作爲參考基礎),這樣的問題應該就不會再被髮問出來了。如果還有,那就只能說明一件事,學藝不精,沒有學透和學懂,基本上就是石錘的伸手黨,又稱白嫖怪。白嫖怪是很難立足的,至少,很難變得讓自己覺得舒服,因爲嘛事都覺得難。當然,在某個具體的技術上,也就不要指望能小有成就了,雖然這不是不可能,只是概率太低了。


在不影響正常的刷分考試的前提下,儘可能的涉獵並透徹的掌握其他任意專業的知識,專業不受約束和限制,同時最好是以本科生教材爲藍本

選擇本科生教材的原因是,其內容無需再做更多的補充和完善,也基本不存在錯誤,其所涉內容更是以系統和建制體系的形式出現,省去了查證真僞和正確與否的過程,能節約不少精力。

第二個原因是,如果有不懂的,可以相對輕鬆的找到教輔圖書資料。只要你願意花錢或者願意鑽研(比如翻帖子),就一定能找到。

之所以要這樣,是因爲,在未來你可能會投身的大數據崗位上,僅僅掌握一門計算機程序的使用方法(被嘚的上了天好像無所不能的計算機輔助程序,又稱大數據分析軟件),是根本不夠的。可能嗎會說,不是有各種微課程嗎?

微課程的本質

幾乎所有或大多數存在於朋友圈的那些微課程,你都可以找到它的原型,去自學。你務必要知道一件事,那就是,所有的微課程,都是大學本科生教材的私生子。不論它的講課人是誰,也不論講課人的身份有多麼拉風。它是本科生教材的直系血脈的產物,這一點它永遠無法被改變。

它們無一例外或者至少大概率是將本科生教材的內容,東拼西湊再加上一些蠱惑人用於銷售的話術,多方內容,拼湊在一起的縫合怪。而這些縫合怪的價格,可比單純的本科生教材全額的書費,翻了不知道多少倍。如果你沒有意識到這樣的一個客觀事實,只能說你還暫時沒有參悟透事物的本質,多少有點遺憾。雖然在這裏也必須承認,有不少教材也是一鍋煮糊了的稀飯,喂不飽,但即便如此,也還是比以商業吸金冥氪的課程要仁慈和靠譜點。仁慈,指不至於飆到離譜的價格,靠譜,指至少內容的邏輯和框架及嚴謹程度,經過了教育部教材編審委員會的審覈和鑑定,空假套水的內容理論來說,會盡可能的少。

當你能喫透了本科生教材,或至少對某個具體的專業知識有了一個相對體系化、健全的瞭解之後,就會發現,那些微課程就是在水字數,騙錢。,對於一個妥妥的騙錢的東西——本科生教材的縫合怪,明知道是智商稅,你還會去掏錢嗎?少花點時間刷朋友圈,少看幾部電影,少點旅遊,書都看完了好幾本了,就是有點費時間,但至少不怎麼花錢,也不怎麼費鞋子不是?

 

微課程的學習遇到困難看不懂怎麼辦

你可能會說,看不懂咋辦?除了要加強對於書面文字的理解水平之外,你還有一個折中的解決辦法。

看,你還能找到伴侶,有什麼不好的?

實在不行,你可以去別的專業的同學的課堂去蹭課。甚至,甚至,甚至,運氣好的話,還能遇到情投一盒的老婆大人和兩情相悅的老公醬醬。這又不是沒有可能,而且可能性還非常非常非常大。你看,書中自有顏如玉,書中自有中郎醬。

現在網絡如此發達,你想看哪門課,它們的視頻課程幾乎都能找到。


在不影響正常的考試及學業的前提下,試着默寫某本或任意一本教材的大綱內容,爭取做到分毫不差

這件事也是幾乎費力不討好的活,但如果你想在大數據從業這件事上有所建樹,這事你還真得認真對待。

原因非常簡單。

因爲,前文已經向大一的你非常客觀的介紹了大數據從業以及你即將面對的、以後一定會面對的各類實際場景。這些場景對於大一的你來說,毫無疑問,那就是人間地獄,精神審訊室加精神刑具調教室,痛苦,是大大的。而如果你想以鴕鳥心態去面對,最後,還是無法逃掉該有的折磨。怎麼才能儘可能的減輕自己的痛苦,忍受盡可能少的折磨?

試着將一門具體的專業技術徹底的喫透,而這,就要成爲日後你喫飯的壓箱底的技藝了。它和考試刷分刷題沒有任何的邏輯關聯。你考試高分,不代表你就將這門課喫透了。因爲考試不是全篇高強度高深度或者無一遺漏的全部覆蓋,它一定會有側重點和輕視或無涉及的地方。所謂考試大綱,就是將考試要考的內容所涉、深度、強度都如同腳本一般顯現告知給你了。在告知了考生要考什麼什麼都前提下,只需要有針對性的刷題就行。然而,這真不代表更不意味着你就全部都弄懂了。

如何才能算的上是喫透了呢?只要你能在任何時間、任何地點、任何場景、不借助網絡查詢、不翻看原圖書、不向除你自己之外的任意第三人求助的狀態下,將任意一門課本(因爲你目前還不可能接觸到除課本之外但是其內容卻又和課本一樣是成體系成建制並且內容經過鑑定和審覈是幾乎無遺漏和錯誤的另外一種存在狀態和形式的知識或技能了)的內容,使用任何形式,包括但不限於思維導圖軟件或流程圖軟件以及最原始的紙和筆或口述,按照或接近原書的框架結構、邏輯,完好無損、無遺漏、無錯誤的呈現出來。做到這一點,才能算是你真正喫透了。

說人話就是,(相當於)默寫或口述原書的目錄,如果可以的話,將原書目錄下沒有的但是在正文內容卻存在的三級或者四級標題,也默寫或口述出來。用更爲簡單的措辭來說就是,對於全書所涉的任意內容,信手拈來,如數家珍,滔滔不絕而無一錯誤、紕漏。

只有這樣,才能勉強算的上是基本掌握了一門特定的知識或技藝。因爲如果你對相關概念的內容是貓咪玩的毛線球一般的存在的話,你是根本不可能在上述這種環境下將它們無遺漏的敘述出來的,這是不可能的,200%甚至500%不可能。

而一旦當你做到了並且做好了這件考試不考文憑不賣的看起來費力不討好的事以後,則標誌着你開始或者說已經逐步建立起一個初具成型的個人知識儲備庫了。當你能做到更多數量圖書的內容的這般呈現,你將無限接近於Silent Hunter ,啊,不對,Sherlock Holmes。

最使我(按:華生)驚訝不止的是:我無意中發現他(按:福爾摩斯)竟然對於哥白尼學說以及太陽系的構成,也全然不解。當此十九世紀,一個有知識的人居然不知道地球繞着太陽運行的道理,這件怪事簡直令我難以理解。

他看到我喫驚的樣子,不覺微笑着說:“你似乎感到喫驚吧。即使我懂得這些,我也要盡力把它忘掉。”

“把它忘掉!”

他解釋道:“你要知道,我認爲人的腦子本來象一間空空的小閣樓,應該有選擇地把一些傢俱裝進去。只有傻瓜纔會把他碰到的各種各樣的破爛雜碎一古腦兒裝進去。這樣一來,那些對他有用的知識反而被擠了出來;或者,最多不過是和許多其他的東西摻雜在一起。因此,在取用的時候也就感到困難了。所以一個會工作的人,在他選擇要把一些東西裝進他的那間小閣樓似的頭腦中去的時候,他確實是非常仔細小心的。除了工作中有用的工具以外,他什麼也不帶進去,而這些工具又樣樣具備,有條有理。如果認爲這間小閣樓的牆壁富有彈性,可以任意伸縮,那就錯了。請相信我的話,總有一天,當你增加新知識的時候,你就會把以前所熟習的東西忘了。所以最要緊的是,不要讓一些無用的知識把有用的擠出去。”

我分辯說:“可是,那是太陽系的問題啊!”

他不耐煩地打斷我的話說:“這與我又有什麼相干?你說咱們是繞着太陽走的,可是,即使咱們繞着月亮走,這對於我或者對於我的工作又有什麼關係呢?”

1.文學知識——無。

2.哲學知識——無。

3.天文學知識——無。

4.政治學知識——淺薄。

5.植物學知識——不全面,但對於莨蓿製劑和鴉片卻知之甚詳。對毒劑有一般的瞭解,而對於實用園藝學卻一無所知。

6.地質學知識——偏於實用,但也有限。但他一眼就能分辨出不同的土質。他在散步回來後,曾把濺在他的褲子上的泥點給我看,並且能根據泥點的顏色和堅實程度說明是在倫敦什麼地方濺上的。

7.化學知識——精深。

8.解剖學知識——準確,但無系統。

9.驚險文學——很廣博,他似乎對近一世紀中發生的一切恐怖事件都深知底細。

10.提琴拉得很好。

11.善使棍棒,也精於刀劍拳術。

12.關於英國法律方面,他具有充分實用的知識。


按照S.H的觀念,人的知識儲備應該像一個倉庫。不論是什麼知識,都應該以倉管的形式,按門類按種類分級且有條理的存儲。如果對於這一點不是很明白的話,非常建議你將帶獨立緩存的固態硬盤的工作原理並儲存機制弄清楚,再來看這段理論,大概就能明白了。只不過,用於儲存信息的電子,換成了人的腦細胞,說的再直白一點就是用於存儲特定信號的條件反射弧(對於這段文字不明白的你,可以查閱下高中生物,關於記憶的那部分內容),主控則變成了人的思想意識下的思考(事理的)邏輯

因爲所有的知識可以做到門類清晰,隨用隨調,並且關於這些知識的深層次結構和近乎完整的內容大致能做到了如指掌,又因爲你已經掌握了數量、種類都比較可觀的知識,所以,在當你真正面對所謂的大數據從業崗位的具體的某個大數據分析的任務時,理論來說,不僅沒有精神壓力,反而還可以在很短時間內拿出解決這個任務的全盤思路、流程、策略、重難點、所涉及的具體學科(這是最重要的。相當於找到了能夠歸口的方向,即使要找資料,也能很快的定位,在有了一個幾乎明確的方向所指後,找資料的方向也更清晰了,爲此將能節約大量的時間),這對你來說,無疑是從業優勢,至少可以拉開和他人的差距,凸顯你的不同。由於你涉獵衆多,見到和遇到的也比其他人多,故而,思路也因之更開闊,眼界也比別人看的更遠更寬更深,能找到和發現別人無法發現的視野和思路盲區。當然最重要的是,你可以故意裝作壓力很大,將主動權掌握在自己手裏,實際則不緊不慢穩步推進的進行着預定計劃。你甚至還可以藉此機會摸魚,藉口是,工作壓力太大,只能“擺爛”,緩慢推進。

而這些因爲建立起清晰的思路、看待事物的邏輯、策略、方法帶來的優勢以及涉獵衆多帶來的知識儲備,會讓你的大數據分析更具有可行性、更接近事理的真相、更容易被客戶所接受和認可(前面也已經解釋過了,所謂大數據分析,就是做邏輯推理。正確的推理是建立在充足且必要的認知這一基礎之上的。它除了需要嚴格的邏輯推導過程之外,還需要在掌握數量相當的各專業知識的基礎上結合實際情況進行分析和判斷。而推理的正確性要在實踐中不斷驗證和修正。你不能開口閉口什麼智慧算法,什麼智能算法,又或者什麼什麼Ai,都要先跑個ai才能展開。如果是這樣,那醫院急診科就別開了,也別去了。因爲沒有ai跑完,我不能盲目無知粗暴的去下結論,對吧?對吧?……這些,不是說掌握幾個所謂算法,又或者考取了什麼什麼軟件資格等級認證,就能獲得的。請時刻牢記,它和敲門磚學歷沒有任何關係。如果你是借殼黨,你會發現,如果你思路一片混亂,哪怕你借的殼多麼好看,你終究還是會嚴重精神衰弱。這是誰的問題?)。當這種認可次數多了,你也可能會被同事及上級讚許,有概率晉升,不過這些都是後話了。


掌握一門除計算機編程以外的任意一門專業技術

計算機技術,特別是編程技術,雖然是時下大數據行業,離不開各類所謂的數據分析軟件。而這裏面就少不了計算編程。於是,各個學校將編程好計算機語言作爲此專業的必修和重點科目就成了一件看起來和聽起來都很正確的事情。於是開口閉口就是編程、 語言、數據庫等言詞。

但是:

計算機編程,類似於數學的代數計算公式、幾何的定義與原理,如果沒有具體的運用對象,她們只能是單調且幾乎只能成擺設一般的存在,因爲終究無法直觀感受到它的實際作用於效果。只有將代數符號、代數公式形成的計算公式的每個字符與具體的單位(計量或衡量單位)相關聯、綁定,它的作用纔會被人重視和在意,才能起到應有的作用。

計算機編程正是這樣的代數運算式。某個大數據軟件也是同理:程序軟件確實很強,可以在一定程度解放雙手,但這軟件要做什麼怎麼做,流程步驟,它並不能全自動。若真能全自動,還要工作人員做啥?你什麼時候見過能自動組成微積分方程式的軟件?輸入指令,給出要求,自動成式?

程序也好,軟件也罷,她本質上來說,就是一個計算器。軟件、程序的不斷髮明與創造,其本質是從簡單的心算到紙筆劃拉打草稿到算盤或算珠到第一代按鍵計算器到可以進行冪指對運算的計算器到可以運算三角函數和微分和積分的計算器到可以進行多用途換算的計算器,由實物到虛擬化的一個演變。所謂實物,紙筆——算盤——鍵盤計算器——虛擬化的手機計算器程序和電腦上的計算器程序——各類大數據運算並解析軟件。

關鍵是,這計算器她本身還在不斷的進化。可是,人的精力是有限的,想做到100%跟得上,100%同步,是非常困難的。況且,還有一部分人,會因爲年齡的原因,面對技術的更新而力不從心(雖然必須說,不止年齡原因而無法同步,就算年齡不大,一樣無法做到同步)。失去同步,結束罪惡的一聲。刺客信條。

一言概述之,你目前所學,只是如何使用計算器及高級計算器的使用技巧。誰都知道,會用計算器,啥事也坐不了。因爲就連初小的同學都會用。難道不是?如果不能將其運用到具體的事情上,是幾乎沒有什麼用的。

如何才能解決這個尷尬?很簡單,你得掌握一門具體的技術。或者,一路黑到底,將計算器的使用,發揮到別人不可匹敵不可企及望塵莫及的高度,但大多數人是做不到的。如果你並不認可這個計算器理論或觀點,那,可以腦補下下面這個場景:

你是一個英語專業的學生,除了英語,你其他任何專業的相關知識都不懂,並且,還拿到專六的資格證。你歡天喜地,覺得人生美好之路就此開啓。然後,現在,你如願應聘成了一名翻譯,但是要你翻譯的文件是一份工程機械的專業英語資料,又或者航天航空、航海專業的英語,又或者生物醫藥和醫學的資料,並且以上內容需要你在規定的時間內完成,因爲這就是你這個翻譯要做的工作。通篇的專業術語和專業內容,讓你頭皮發麻。試問,你要如何應對?你可不是英語專業的學生,難道這都看不懂做不了嗎?

沒有半點專業背景,就想憑藉使用計算器和   ,來干預和上手相關行業的大數據解析工作,只有心大的人,纔敢,纔會有這種想法。就算是所謂的團隊合作,你真的以爲聯合作業和協同作業是那麼簡單的?你可知道,黴菌你聯合作戰司令部成立了,五大軍種之間磨合了多久纔有現在這種到處欺負人的水平的?即便是現在,依然還有很多不足。

你的心是有多大,膽子在太陽系之外,讓你有了這種想法?


 重視各類信息並儘可能爲自己的衣食住行學所用

大數據囊括了公開信息、媒體所吹的開源信息、非公開信息。

公開信息,只要有渠道,就能查到。後者,需要密法才能拿到。

前者的渠道,包括但不限於對外公衆開放及發行的新聞、公告、雜誌、報告、報道、書刊、報紙、社交平臺的動態、網站、文章等。只要有合理的消防梯,就能查到。但查到了不代表就表示你也知道或完全知道了。通過這些查到的信息展開初步的簡析,來獲得更深一層次的內容,這纔是大數據解析。

非公開信息,她算半個公開信息。因爲她是對於公開信息的研究解析才能得到的內容:在什麼樣的歷史及世界背景前提、原因下以什麼時間什麼地點由什麼參與人組織併發生了什麼事。參與人及各相關方都是什麼,因爲什麼原因選擇了事發地,因爲什麼原因發生了以什麼樣的起因、經過、結果的事,事的詳細細節是什麼,這件事的意義、作用、效果、經驗、性質、教訓、心得是什麼,這件事的發生說明了什麼、意味着什麼、預示着什麼、表明了什麼。涉及到的人員的詳細信息都是什麼。

這些都是基於開源和公開信息的解析拿到的。如果思緒混亂,是不可能得到以上這些信息的。

這種簡單初級的信息預製,從學科的分類上來說,可以大致歸屬爲刑事偵查學、詢問學。至少,沿用了這兩門學科的思想和策略。

這不是說用幾個所謂幹活的模板拿來套用、上幾個速成班就能學到和掌握甚至就此就能知道的。

要想做到,要想所見即所得——在看到這些信息的第一瞬間,上述信息就基本已經在頭腦中形成,就已經有了大致的結論和初級的判斷,沒有別的任何辦法,只有研習其他專業的知識,並且試着將所研習到的全部內容捏到一起,形成一個龐大的整體(如前文所說的,福爾摩斯的柵格理論)x0。做到看到便想到,想到便知道,知道便明白,這事聽起來挺容易的,對吧?但做起來並不容易。它沒有任何捷徑沒有任何速成班。那些所謂的培訓課程,速成班,基本做不到這一點,不管它們的宣傳廣告寫的有多麼好多麼多麼神。只有擴大了自身所掌握的相關的學科專業知識的範圍,纔能有機會做到否則就是迷之自信。


大數據最高境界就是讓對方老老實實積極主動心甘情願的向你交代一切掏心置腹無任何保留

做到這一點,除了理論上通過無差別無死角的各學科知識的掌握來進行開口跪的信息獲得之外,剩下的一條路就是通過與其人產生交集交往,贏得並獲取對方的認可,令之崇拜有+、崇敬至極、尊敬,使其無所不言,無辭不真,無所不談,幾乎傾囊相訴,成爲無話不談沒有任何隱私保留的好友。如此一來,大數據就……

如果可能並且可以的話,因爲你的學識令人矚目,或不可小覷,於是,你將有機會進入到其人的活動圈內。對你而言,你的交際圈的範圍變大了,有非常大的概率會遇到其他行業、領域的從業人員,然後依舊使用你出衆的學識,來與之交往。在交往的過程中,你的社交圈將再一次擴大,並且,因爲人員行業衆多,所以,對於各行業、各職業、崗位的大數據信息,將會在閒聊之中輕鬆獲取。

將這些信息進行樂高拼接,就能得到一份很不錯的商業大數據了。


如果可以,請在任何時候進行大數據統計與記錄

雖然這樣做會讓人覺得很是無聊,並且這事註定會很傷神,但還是請試着這麼去做。

具體的對象——

如乘坐公交:費用、時間、距離、試着歸納自己的行蹤的規律特徵。

如假期旅遊:目的地、出發地、途經地、交通方式、交通時間、交通費用、購票渠道、抵扣卷使用情況、出發時間精確到日時分秒、抵達時間及中轉時間精確到日時分秒、同行人員及相關關係、攜帶物資清單詳情、始發站點、途經站點、目的站點、線路規劃及備選方案、沿途(人、事、物、建築、人文、居住環境、費用、當地氣象條件和所在時候每日氣象情況,包括但不限於氣溫、風力、風向、乾溼度、紫外線輻射程度、當地方言、目的地看點、目標或觀看對象的(歷史、價格也就是門票、抵達方式走路還是纜車還是其他形式)、出行期間美日三餐詳單(價格、品類、製作方式、口感、色調、選擇她的原因)、全程總花費、日花費詳單、全程總路程(可以用計步器計算)。

這些是個人大數據的一部分,而你供職的單位進行的所謂商業大數據分析,就是由這樣的許多個你做爲樣本而構成。

當你親身經歷、親筆動手編撰,多來幾次,你就知道商業大數據的樣本蒐集和分析的重點和要義是什麼了。這爲你日後展開或從事相關的工作,能積累不少一線的實際經驗,包括參數設計、流程、步驟、原因解析等。

當然當然,這些還能幫助你追求你自己中意的另一半——這可是看不見的奇招。

 

 搜索並關注以下Up主

他們的視頻,幾乎都涉及到信息總結迴歸、信息提取、數據分析,唯一的麻煩就是,你看不到分析和製作視頻的過程,只能看到最後的結果,不過這也足夠了。如果能研究這些up主的研究問題的思路,你不可能沒有漲進。這些Up主,分別是:


從他的第一個視頻開始,一條一條的看。建議將視頻下載下來,然後丟到你的電腦可以跑的視頻剪輯軟件裏面去,將畫面展開涉及到算法的那一幀,截圖下來。仔細查看,仔細記錄。只要將這位up主的視頻都按照這種方法來對任意目標對象展開解析,你的大數據實戰水平也基本有了質的飛躍。不至於說,處事沒有思路,這是不可能的。除非你一路只會喊666,除此之外啥也不做啥也不想

如果真的是這樣

而這些內容,是隻知道買賣交易相關方所根本不及的或者這麼說,賣課的根本不會教給你的。

他有好幾個視頻都是做柯南數據統計的,除此之外還有對主線劇情的邏輯推理。你作爲大數據專業的學生,這樣的邏輯思緒,是必須要掌握的。這其中包括這位up的算法即如何定義的、統計的流程、最後的大數據報告也就是視頻中出現的圖表(視頻暫停可以拿到)、完整的大數據報告的呈現(就是涉及或者說主題爲數據統計和分析的視頻的臺詞即視頻文案你可以將視頻下載下來以後,用軟件導出視頻文案,然後當成模板教材,認真的學習。需要友情提醒的是,寫大數據報告,也是未來從業中,無法迴避的一項工作之一。不論你走到哪,這事都少不了。既然如此,爲什麼不把這種技藝學到手?爲啥?爲啥?

敲鍵盤碼代碼就是大數據的全部?想多了

 

如果你想讓你的思路變的開括和寬廣,那麼請試着閱讀下面這幾本書

或者,類似主題的書,也行。至於推薦這類圖書的原因,前文已經在 “ 一件殊途同歸的事 ” 這篇章做過介紹,這裏就不累贅複述了。


關於大數據的一點哲理性簡析

對任意一個以任意方式、任意手段接觸到的任意對象的所擁有的潛在需要發現與挖掘的或外在直接或者間接接觸就可以獲得並瞭解到的所有的可能的或一定會影響到這個對象所當下或者曾經擁有的甚至未來意識存在形態及可能的物理狀態的全部可能性因素的提取、整理與分析。這便是大數據行爲本質。瞭解並弄清楚了其實質性本質以後,將會顯著提效率和質量。這其實就是大數據實踐性本質。

而這項工作就是解數學的多元多次方程。在這個方程的左邊是構成這個對象的全部的所有因素,它們按照一定的存在方式、搭配方式、存在狀態和方式和存在比例有規律的存在幷包含在這個對象之中。而在這個方程的右邊,就是情報工作的目標或者預期計劃結果。這個方程是可逆的。它既可以從左推導得到右邊的結果,也可以從右邊推導得到左邊的構成因素(詳細)。這就好比知道了結果,就一定要去推導得到原因和起因經過,而知道了起因經過就一定要知道結果。

而這就是簡單的邏輯推理。在化學方程式推演計算、刑事鑑定、案件偵察、數學公式計算推演、戰略/兵棋沙盤模擬推演、預估目標/結果,都是需要進行邏輯推理的。所謂情報分析,其實質原本就是邏輯演算。

當然,這種推理絕對不是隨便亂猜,而是要根據一定的並已知的既定事實,結合相關的且已經被認可、承認的知識理論體系,進行恰當、必要、充分與積極的信息反饋。

這便是情報工作的不因人爲主觀意志的轉移而改變的哲學本質,或者,自然狀態下的物理事實。

美國情報界的全源情報  all  source intelligence 。它是指情報產品或組織、活動包含所有渠道來源的信息,通常最終形成的情操產品。包括人力情報、圖像情報、測量和特徵情報、信號情報和公開來源數據。

全源情報這個概念以及它的定義,……………它比較客觀、準確的描述了情報工作的範圍、單位、手段、技術、方法。

把大數據從業人員看成是噬鐵蟲,把工作對象、研究目標、既定任務看成是隔板這樣的擁有自主意識的獨立的機械生命體的話,結果就只有一個:會被噬鐵蟲拆的連渣渣都不剩。

所有的任務、工作對象、研究目標等所有的目標對象所包含的元素會被像噬鐵蟲分解汽車人那樣被拆解和分屍。————所有的目標、任務、對象裏面包含的全部元素都會被在第一時間內被情報人員清晰、準確、詳細、無一缺少、邏輯縝密的羅列出來。

如果需要,你應該得出以下信息:1. 這些元素是如何被組裝到一起的;2. 在這麼多元素之中,哪些是重要的核芯部分,哪些是次要的;3. 在這些對象之中又涉及到哪些方面的知識;4. 這些元素(主要是被涉及到的知識中)可能存在的工作原理是什麼,有可能出現的問題是什麼,可能存在其他的技術要求或者技術門檻是什麼。這些任務、工作對象、研究目標的範圍基本上涵蓋了哪些當前所有目前已經被認可的學科知識內容;5.上面這些所涉及到學科的衍生產物又是什麼,它們是如何演變成現在這個樣子的。


以上,就是關於大數據相關專業、從業的一點點小小提示或建議,僅供參考。

如果你有什麼不解或疑惑,可以私信聯繫。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com