機器學習監測哪幾類異常?實際生活中如何應用
2022-05-10來源:CSDN圣普倫官方號
機器學習最廣泛的應用之一是異常監測,尋找和識別異常有助于防止欺詐、對手攻擊和網絡入侵,保證網絡安全。
今天圣普倫將和大家聊聊,機器學習是如何監測異常的。
?
?什么是異常?
不符合正常狀態的情況,或者偏離常規標準過遠的數值。比如說,數據突然狂飆或者瘋狂下跌;錯誤報警、溫度突然升高,出現很大的噪音,或者無限循環;
導致異常的原因可能是數據預處理錯誤,也有可能是病毒攻擊、人為進行遠程欺詐、入侵等等。
遇到異常,你的第一反應是想把問題揪出來,然后胖揍它一頓。最常見的是資金方面,假如你在同一天內,你的賬戶連續被扣款,這是不符合常規的,因為你平時不會在一天內多次消費巨款。這時,機器學習監測到行為異常后,它會
判斷為“欺詐”,并阻止扣款,從而保證你的財產安全。
?
?異常的類型
機器學習工程師通常會遇到哪些異?;虍惓#?br />
1、全球異常值
當一個數據點與數據集內的其他數據值有很大偏差的時候,全球異常值就出現了。換句話說,這個異常千載難逢。
比如,你的銀行賬戶每個月收入1萬元,連續很多年都在一定的范圍內保持穩定。但是,突然有一天,你的賬戶進賬1億,機器學習判斷為“全球異常”
2、上下文異常值
上下文異常,說的是機器學習將會通過上下文(比如環境、最近發生的事件)綜合分析數據異常。比如,一家餐廳在節假日的時候,流量翻幾倍是正常的,但是如果在一個平平無奇,什么事都沒有發生的一天,后臺營收數據暴漲幾
倍,那應該就是出現了上下文異常。
?
3、集體離群值異常
當不是一個,而是多個數據偏離正常標準值過遠時,我們稱為集體離群值異常。比如,一家公司破產,是正常的,但是同一段時間內,大量企業破產,那就是不正常的。
為什么需要機器學習來進行異常檢測?
企業每天都產生大量的數據,用戶點擊數據、交易數據、對話數據、跳出數據等等,而人力是有限的,我們難以從浩如煙海的數據里提取出最有價值的數據,但機器學習可以。
另一個問題是數據經常是非結構化的,亂糟糟一堆,比如商業文件、電子郵件和圖像等內容,面對它們,如何收集、整理、分析,任何一個人都表示頭大,更不用說通過數據發現異常了,這個工作就可以交給機器學習去做,通過算
法,它的效率是人類的N倍。
?
異常檢測的實際應用
1、入侵檢測
網絡入侵,比如非法盜取客戶信息,獲取敏感文件信息,機器學習可以時刻進行檢測,獲取潛在的惡意流量報告。如果檢測到可疑活動,IDS 軟件會向團隊發出警報。比較典型的應用是思科系統和MсАfee 軟件。
2、欺詐檢測
機器學習欺詐檢測有助于阻止金融詐騙。銀行、信用合作社和保險公司都使用欺詐檢測軟件。比如,銀行在決定是否劃掉你賬戶中的資金前,它會先回顧一遍你的貸款應用程序,當檢測到支付文件具備欺詐性(對方賬戶異常、在境
外、有風險),它將會提醒客戶賬戶存在風險,謹慎支付。
?
?3、健康監測
機器學習在醫療領域發揮了重要作用,尤其是在疾病檢測診斷行業,機器學習使用數以萬計的例子來進行訓練和學習,她們的診斷報告有時候比擁有20年行醫經驗的醫生還準確。
4、缺陷檢測
這個通常應用在制造領域,比如汽車制造、飛機制造等。這些設備,如果出現1個零件錯誤,不僅僅會造成經濟損失,還有可能會釀成事故。機器學習則可以用于檢測各個細節是否存在缺陷,如發動機溫度是否過高、燃油量是否充足。
?
?今天就精通異常檢測!
總的來說,機器學習是檢測異常必不可少的一項技術,從入侵檢測到欺詐檢測再到醫學診斷、缺陷檢測,機器學習都可以自動檢測和改進異常檢測,將潛在的風險事故扼殺在搖籃里。
如果你計劃在機器學習領域深耕,可以參加simplilearn圣普倫的機器學習訓練營,課程包括58小時的應用學習、互動實驗室、4個實踐項目和指導,通過圣普倫機器學習認證培訓,你將會掌握機器學習認證考試所需的機器學習知識,比
如數據預處理、異常監測、監督學習和無監督學習、時間序列建模、回歸以及文本挖掘等。