智能語音機器人小知識(7)--什么是交互式語音應(yīng)答?:ivr1.jpg使用ivr可以使客戶戶一天24小時隨時都能得到信息服務(wù),提高服務(wù)質(zhì)量,以及協(xié)調(diào)用戶操作過程。
那是中國呼叫中心產(chǎn)業(yè)的快速發(fā)展時期。在產(chǎn)品及價格日益趨同的今天,服務(wù)質(zhì)量的高低、服務(wù)的多元化及差異化已顯得尤為重要。
顯然,那些以傳統(tǒng)方式經(jīng)營和服務(wù)的企業(yè),已經(jīng)無法滿足消費者的需求,無法在這種爭奪客戶資源的競爭中取得優(yōu)勢。為此,許多企業(yè)開始借助于信息化技術(shù)的應(yīng)用,利用基于計算中心電話交互技術(shù)的呼叫中心來改善服務(wù)。
ivr2.pngivr交互式語音應(yīng)答技術(shù)的特點ivr提供每周7天,每天24小時全天候服務(wù)。ivr為企業(yè)處理大量的日常業(yè)務(wù),無須通過業(yè)務(wù)代表。
顧客通過按鍵或語音選擇,向企業(yè)主機輸入信息,在允許范圍內(nèi)訪問各類企業(yè)數(shù)據(jù)庫,自助得到多種服務(wù),令業(yè)務(wù)代表有更多的時間服務(wù)于有特別要求的顧客。
【bat全球擴張ai路線圖】百度早于谷歌,騰訊投資最多:2016年,阿里巴巴與杭州政府合作,進行智慧城市項目。這個項目主要側(cè)重于減少交通擁堵,并提供實時交通更新。
從那時起,阿里一直與其他地方政府合作,共同打造智慧城市和智能旅游計劃,最近還與馬來西亞政府達成了首次國際合作伙伴關(guān)系。此外,阿里巴巴最近還進行了自動駕駛車輛的測試。
阿里巴巴稱,“城市大腦可以連接各種城市管理系統(tǒng),包括緊急調(diào)度、救護車呼叫、交通指揮和交通信號燈控制等。它可以優(yōu)化城市交通,比如保證救護車輛在最短的時間內(nèi)到達現(xiàn)場。”
商湯科技表示,它將與阿里巴巴合作推出智能交通、城市管理和智能監(jiān)控系統(tǒng)。 騰訊進軍醫(yī)療保健領(lǐng)域通過投資和合作,騰訊將醫(yī)療保健技術(shù)從世界各地引入中國大陸。
現(xiàn)在的中國已經(jīng)變成了數(shù)字化經(jīng)濟,這導致了政府和大型科技公司手中的大量消費者數(shù)據(jù)。
【nsr】中國人工智能迎來黃金時代,跟風發(fā)展快但缺乏重大突破:這種自學習的能力與類腦計算關(guān)系密切,其中包括兩個重要的方面:第一,系統(tǒng)必須要是可塑的,正如人類的大腦一樣。第二,機器要能跟其所在的社會和自然環(huán)境交互。
曾毅:我認為人工智能的圣杯(holy grail)是開發(fā)通用智能系統(tǒng),這種系統(tǒng)由人腦的機制啟發(fā),并且表現(xiàn)得像人類。真正的人類水平的智能系統(tǒng)應(yīng)當可以處理環(huán)境信息,定義問題,然后自己找到解決方案。
中國人工智能的黃金時代蒲慕明:中國在人工智能領(lǐng)域做了什么?需要什么樣政策是支持其發(fā)展?譚鐵牛:在中國,這是神經(jīng)科學和人工智能的黃金時代。中國政府在非常認真地對待這件事。
通過虛擬化計算技術(shù),現(xiàn)在我們研發(fā)出的處理器雖然很小,但是可以在神經(jīng)網(wǎng)絡(luò)中模擬不限數(shù)量的神經(jīng)系統(tǒng)和突觸。蒲慕明:在中科院自動化研究所呢?您覺得有什么進展?曾毅:腦啟發(fā)智能是我們研究所的關(guān)注點。
并行大腦模擬器也是一系列認知機器人的“大腦”,這個人工大腦的多個區(qū)域可以相互協(xié)調(diào)執(zhí)行各種認知任務(wù)。
強強聯(lián)袂!騰訊云與國雙戰(zhàn)略簽約,錨定國產(chǎn)數(shù)據(jù)庫巨大市場:日前,騰訊云計算(北京)有限責任公司與北京國雙科技有限公司簽署了《國產(chǎn)數(shù)據(jù)庫產(chǎn)品戰(zhàn)略合作協(xié)議》,雙方將在數(shù)據(jù)庫技術(shù)方面展開深度合作,通過分布式交易型tdsql數(shù)據(jù)庫的聯(lián)合研發(fā)、產(chǎn)品服務(wù)體系建設(shè)、品牌和市場共建
,進一步擁抱云原生,共建共贏生態(tài),為千行百業(yè)提供企業(yè)級數(shù)據(jù)庫解決方案,助力產(chǎn)業(yè)發(fā)展、企業(yè)和政府組織的數(shù)字化智能化轉(zhuǎn)型。
國雙自主研發(fā)的新一代云原生并存并算數(shù)據(jù)倉庫產(chǎn)品在賦能企業(yè)和政府組織數(shù)智化轉(zhuǎn)型的進程中發(fā)揮著獨特的作用。
今天,我們能夠與騰訊云聯(lián)袂出陣,優(yōu)勢互補互為生態(tài),相信一定能夠通過國產(chǎn)數(shù)據(jù)庫的建設(shè),為大型企業(yè)和政府數(shù)字化轉(zhuǎn)型做出貢獻?!?tdsql金融核心系統(tǒng)客戶數(shù)國內(nèi)領(lǐng)先 ↓↓點擊閱讀原文,了解更多優(yōu)惠
南陵縣政府辦公政務(wù)OA系統(tǒng):滄 縣政務(wù)政務(wù)OA系統(tǒng)中覆蓋四種場景、包含正負向反饋,騰訊、西湖大學等發(fā)布推薦系統(tǒng)公開數(shù)據(jù)集tenrec用性,通過手機即可隨時隨地的處理“公文流轉(zhuǎn)、公文簽批、日程管理、通訊錄、新聞資訊”等等在內(nèi)的企業(yè)辦公功能,解放了管理者和使用者,讓辦公真正高效起來。既然
移動辦公成為未來發(fā)展趨勢,那么協(xié)同管理
政務(wù)OA系統(tǒng)辦公軟件廠商該如何在
移動辦公軟件上發(fā)力呢?多數(shù)業(yè)內(nèi)人士認為技術(shù)創(chuàng)新是關(guān)鍵,而對于技術(shù)上始終保持領(lǐng)先優(yōu)勢的
政務(wù)OA企業(yè)來說,負責人表示技術(shù)基礎(chǔ)之上,拓展性強的功能更為重要,進一步講則是項目落地能力要強,才會展現(xiàn)出協(xié)同管理
電子政務(wù)oa系統(tǒng)系統(tǒng)的服務(wù)品質(zhì)?!耙苿?a href="http://www.dblinkclub.com/" target="_blank" style="font-size:16px; line-height:35px;color:red;">政務(wù)OA系統(tǒng)生逢其時,但是移動
政務(wù)OA系統(tǒng)必須適應(yīng)隨需而變的應(yīng)用環(huán)境,如果從資源整合延伸到功能拓展,很大程度上能夠滿足多數(shù)移動化辦公人群的需求?!币?a href="http://www.dblinkclub.com/" target="_blank" style="font-size:16px; line-height:35px;color:red;">政務(wù)OA負責人的觀點,移動化
OA辦公軟件的項目落地能力成為系統(tǒng)服務(wù)品質(zhì)高低的“分水嶺”,言外之意不是從pc端轉(zhuǎn)機器之心專欄
機器之心編輯部
來自騰訊、西湖大學的研究者發(fā)布了一種新的推薦系統(tǒng)數(shù)據(jù)集 tenrec,記錄了來自四種不同推薦場景的各種用戶反饋。
近些年來,通過各種內(nèi)容平臺瀏覽視頻或者是閱讀文章的用戶越來越多,而現(xiàn)有的推薦算法有時難以很好地建模用戶的偏好,因此需要更準確的推薦系統(tǒng)模型。但已知的推薦系統(tǒng)(rs)的基準數(shù)據(jù)集要么是小規(guī)模的,要么是用戶反饋形式非常有限。在這些數(shù)據(jù)集上評估的推薦系統(tǒng)模型往往缺乏實用性,難以為大規(guī)模真實場景應(yīng)用提供足夠的價值。
在本文中,來自騰訊、西湖大學的研究者發(fā)布了 tenrec 數(shù)據(jù)集,一套超大規(guī)模的推薦系統(tǒng)公開數(shù)據(jù)集和評測基準,它記錄了來自四種不同推薦場景的各種用戶反饋。
論文地址:https://arxiv.org/abs/2210.10629
代碼地址:https://github.com/yuangh-x/2022-nips-tenrec
數(shù)據(jù)集地址:https://static.qblv.qq.com/qblv/h5/algo-frontend/tenrec_dataset.html
具體來說,tenrec 有 以下五個特點:(1)規(guī)模大,包含約 500 萬用戶和 1.4 億次互動;(2)不僅有正向的用戶反饋,也有真實的負反饋;(3)它包含四種不同場景中重疊的用戶和重疊 items;(4)它包含各種類型的用戶正反饋,以點擊、點贊、分享形式等;(5)它包含了除了用戶 id 和 item id 之外的附加特征,如用戶年齡、性別和 items 類別等。
研究者通過對每個任務(wù)運行幾個經(jīng)典的 baseline 模型來驗證 11 個不同的推薦任務(wù)上的 tenrec 表現(xiàn)。tenrec 有很大的潛力成為一個對多數(shù)流行推薦系統(tǒng)任務(wù)有用的基準數(shù)據(jù)集。
數(shù)據(jù)集描述
tenrec 是一個為多個推薦任務(wù)開發(fā)的數(shù)據(jù)集,數(shù)據(jù)收集來自騰訊的兩個不同的內(nèi)容推薦平臺(qb 和 qk)。qk/qb 中的一條數(shù)據(jù)可以是一篇圖文或一段視頻。需要注意的是,圖文推薦模型和視頻推薦模型是分別用不同的神經(jīng)網(wǎng)絡(luò)和特征進行訓練的。因此,可以認為 tenrec 總共是由四個場景的用戶反饋組成的,即 qk-video、qk-article、qb-video 和 qb-article。研究者從兩個內(nèi)容平臺收集用戶(匿名處理)的行為日志,首先從 qk-video 的數(shù)據(jù)庫中隨機抽取五百萬的用戶,抽取的這些用戶至少包含五個及以上的點擊行為。然后再抽取用戶的相關(guān)行為,包含正反饋行為:點擊、分享、喜歡和關(guān)注等,負反饋行為:item 曝光但無點擊的用戶行為。最終抓取約 1.42 億的點擊行為,1 千萬的喜歡行為,1 百萬的分享行為和 86 萬的關(guān)注行為以及總共 3.75 百萬的視頻數(shù)量。除了用戶行為以外,還包括經(jīng)過脫敏處理后的用戶年齡、用戶性別和物品類別等特征。對于 qk- article、qb-video 和 qb-article 場景采用相似的數(shù)據(jù)處理方式,其中 qk-video 為主場景數(shù)據(jù)集,另外三個為次要場景,可用于推薦系統(tǒng)中的遷移學習場景或者冷啟動場景等。詳細的數(shù)據(jù)統(tǒng)計可見下表 1。
圖 2(a)和 (b) 顯示了 qk-video 在點擊行為中的 item 頻率。由下圖可得,item 頻率遵循典型的長尾分布。(c)展示了會話長度的分布,其中具有 [0~20] 長度的會話的數(shù)量占所有會話的 53%。另外三個數(shù)據(jù)集有相似的結(jié)論。
其次,tenrec 在四個場景中有重疊的用戶和 item。對于用戶,我們統(tǒng)計 qk-video 和 qk-article,qb-video,qb-article 的重疊數(shù)量,因為 qk-video 覆蓋了最多的用戶、items 和交互。其中,qk-video 和 qk-article 重疊用戶數(shù)為 268207,qk-video 和 qb-video 重疊用戶數(shù)為 3261,在 qk-video 和 qb-article 之間的重疊用戶數(shù)為 58。對于 items 的重疊數(shù)量,qk-video 和 qb-video 之間有 78,482 個重疊的視頻。重疊的用戶和 items 可以通過其唯一的 id 索引進行關(guān)聯(lián)。由于 tenrec 有交疊的用戶和 items,因此它非常適合用于研究遷移學習和交叉領(lǐng)域?qū)W習等任務(wù)。
除上述所說的優(yōu)勢之外,tenrec 和現(xiàn)有的推薦系統(tǒng)不同的是,它包含不止一種用戶反饋。qk-video 和 qb-video 除了用戶點擊行為外,還包括點贊,分享和關(guān)注等行為,這些行為比點擊行為更加能夠反映出用戶的偏好程度。在 qk-article 和 qb-article 同樣有用戶的正反饋,除上述行為之外,還包括閱讀行為和喜歡行為。除了上述的各種正反饋行為外,tenrec 還包括真實的負反饋行為,即 item 展示給用戶,但是用戶不感興趣并沒有點擊 item。真實的負樣本可以幫助 ctr 等推薦系統(tǒng)任務(wù)更加真實地學習到用戶的興趣。
tenrec 數(shù)據(jù)集具體的特征如下所示,qk-video/qb-video 的特征包括 {user id, item id, click, like, share, follow,video category, watching times, user gender, user age}。其中 click, like, share, follow 特征是二值屬性,代表用戶是否有相關(guān)的行為。video category 是視頻類別,watching times 是用戶觀看該視頻次數(shù)。而有敏感信息的 user id, item id, user gender, user age 特征都做了匿名化處理。另外,qk-article/qb-article 的特征包括 {user id, item id, click, like, share, follow, read, favorite, click_count, like_count, comment_count, exposure_count, read_percentage, category_second, category_first, item_score1, item_score2, item_score3, read_time}。其中“*_count” 代表的是相應(yīng)行為的總數(shù)量, read_percentage 是用戶的閱讀完成度,取值范圍從 0 到 100。category_first 和 category_second 是文章的類別,其中 category_first 是粗粒度類別(如體育、娛樂、軍事等),category_second 是細粒度類別 (例如:nba、世界杯、科比等)。item_score1、item_score2、item_score3 表示不同評分系統(tǒng)給出的打分。read_time 是閱讀的持續(xù)時間。
實驗驗證
接下來研究者將用十一個不同的推薦任務(wù)驗證 tenrec 數(shù)據(jù)集。
1、ctr prediction
ctr prediction 是一個經(jīng)典的推薦任務(wù),其目標是預測用戶是否要點擊一個推薦的項目。研究者在 qk-video 的采樣版本上執(zhí)行這個任務(wù),即隨機抽取從 qk-video 數(shù)據(jù)集中抽取 100 萬個用戶,稱為 qk-video-1m。
數(shù)據(jù)預處理:在處理過程中保留所有的正反饋(點擊行為),并抽取一部分真實負反饋,正 / 負抽樣比為 1:2。通過這樣做,我們總共獲得了 1,948,388 個項目和 86,642,580 個交互作用,可以達到 96.7% 的稀疏性。然后研究者將數(shù)據(jù)切分成 8:1:1,分別作為訓練集,驗證集,和測試集。訓練樣本包括如下特征:user id、item id、性別、年齡、視頻類別和用戶 10 個歷史點擊項目。我們分別對上述特征做特征嵌入。
baseline 模型:在該任務(wù)中,研究者使用如下模型:wide & deep, deepfm, nfm, xdeepfm, afm, dcn, dcnv2, din, dien。另外,進行了共享歷史 embeddings 和非共享歷史 embeddings 的實驗比較。
實驗結(jié)果:上表顯示了不同方法在 qk-video-1m 數(shù)據(jù)集上的 auc 評估指標結(jié)果??梢杂^察到,一般來說,這些 ctr 模型的表現(xiàn)非常相似。其次非共享歷史 embeddings 的表現(xiàn)要略好于共享 embeddings。
2、session-based recommendation
基于會話的推薦(sbr),也稱序列推薦,給定一個會話序列(即之前的交互 items),目的是預測下一個 item,sbr 的一個關(guān)鍵特征是在訓練過程中明確地建模交互順序,這通常會產(chǎn)生更好的 top-n 結(jié)果。
數(shù)據(jù)處理:研究者使用 qk-video-1m 來評估各個 baseline 模型。遵循常規(guī)的實驗設(shè)置,研究者過濾掉序列長度小于 10 的會話,同時設(shè)置會話的最大長度為 30。經(jīng)過數(shù)據(jù)預處理之后,可以得到 928,562 個用戶,1,189,341 個 items 和 37,823,609 個點擊互動。實驗保留會話中的最后一項用于測試,最后第二項用于驗證,剩下的用于訓練。
baseline 模型:在該任務(wù)中,研究者使用如下模型:gru4rec, nextitnet, sasrec, bert4rec。
實驗結(jié)果:研究者使用標準的 top-n 排名指標來評估所有的模型,即 hr 和 ndcg。n 被設(shè)置為 20。表 3 顯示了 4 個模型試驗的結(jié)果。觀察結(jié)果如下:(1)單向模型 gru4rec、nextitnet 和 sasrec 在 hr@20 和 ndcg@20 上比雙向 bert4rec 提供更好的結(jié)果。(2)在相同的訓練方式下,三個單向模型的性能相似。
3、multi-task learning for recommendation
多任務(wù)學習(mtl)的目標是同時學習兩個或多個任務(wù),同時最大化其中一個或所有任務(wù)的性能。在這里,我們試圖對用戶對點擊和點贊的偏好進行建模而不是其中之一。該任務(wù)中使用與 ctr prediction 相同的數(shù)據(jù)集和分割策略。不同之處在于,該任務(wù)有兩個輸出目標,一個用于點擊,另一個用于點贊。考慮到 tenrec 包含了許多類型的用戶反饋,人們可以利用更多的目標來構(gòu)建更具挑戰(zhàn)性的 mtl 任務(wù),例如 3 個、4 個甚至 6 個任務(wù) (即通過點擊、點贊、分享、關(guān)注、閱讀、收藏等) 從 qk-article 數(shù)據(jù)集學習。
baseline 模型:在該任務(wù)中,研究者使用如下模型:esmm、mmoe、ple。
實驗結(jié)果:表 4 顯示了四種方法在 qk-video-1m 數(shù)據(jù)集上 auc 的結(jié)果。正如我們所看到的,esmm 在點擊和點贊的預測方面都比 mmoe 表現(xiàn)得更好。
4、transfer learning for recommendation
遷移學習(tf)——首先通過預訓練,然后進行微調(diào),這已經(jīng)成為 nlp 和 cv 中常用的方法。該任務(wù)中,首先在源域預先訓練 sbr 模型(即 nextitnet 和 sasrec),然后在目標域中使用相同的模型(其他參數(shù)隨機初始化),將在源域?qū)W習到的隱藏層參數(shù)遷移到目標領(lǐng)域中(即 cnn 和 self-attention 的參數(shù))。
數(shù)據(jù)預處理:使用在 sbr 任務(wù)中的數(shù)據(jù)集作為源數(shù)據(jù)集,并使用 qb-video 點擊反饋作為目標數(shù)據(jù)集。
baseline 模型:在該任務(wù)中,研究者使用如下模型:nextitnet、sasrec。
實驗結(jié)果:表 5 顯示了有和沒有預訓練的比較結(jié)果。觀察可得,nextitnet 和 sasrec 通過預訓練能產(chǎn)生更好的 top-n 結(jié)果。這表明,從大型訓練數(shù)據(jù)集學習到的隱藏層參數(shù),可以作為在目標域訓練數(shù)據(jù)不足時模型參數(shù)的初始化。
5、user profile prediction
用戶個人信息是個性化推薦系統(tǒng)的重要特征,特別是對冷用戶或者新用戶的推薦。最近,相關(guān)文獻證明了通過對用戶的點擊行為進行建模,可以很準確地預測用戶的個人信息。
數(shù)據(jù)預處理:研究者在 qk-video-1m 上完成實驗。先移除沒有個人信息特征的用戶,然后按照 8:1:1 的比例劃分成訓練集、驗證集和測試集。
baseline 模型:在該任務(wù)中,研究者使用如下模型:dnn、peterrec 和 bert4rec。
實驗結(jié)果:表 6 顯示了 5 個 baseline 模型的 acc 結(jié)果。首先,peterrec 和 bert4rec 的表現(xiàn)優(yōu)于 dnn,表明建模用戶序列行為時 cnn 和 self-attention 網(wǎng)絡(luò)更強大。第二,peterrec 和 bert4rec 的有預訓練比從零開始訓練效果更好。
6、cold-start recommendation
冷啟動是推薦任務(wù)中一個懸而未決的挑戰(zhàn)。tenrec 的一個主要優(yōu)點是有用戶重疊和 items 重疊的信息,因此可用于解決冷啟動的問題。
數(shù)據(jù)預處理:該任務(wù)中 qk-video 作為源數(shù)據(jù)集,qk-article 作為目標數(shù)據(jù)集。為了更加貼合實際場景,研究者設(shè)置了幾個不同的冷用戶場景,例如全冷用戶和冷熱用戶混合場景。同樣的,這里設(shè)置 8:1:1 的數(shù)據(jù)劃分策略。
baseline 模型:在該任務(wù)中,研究者使用如下模型:peterrec 和 bert4rec。
實驗結(jié)果:表 7 顯示了 cold-start recommendation 的結(jié)果。首先,我們發(fā)現(xiàn) peterrec 和 bert4rec 通過預訓練都有明顯的效果提升。
7、lifelong user representation learning
當把一個模型從一個領(lǐng)域遷移到另一個領(lǐng)域時,在原始任務(wù)訓練的參數(shù)往往會被修改來適應(yīng)新的任務(wù)。因此,模型將不再適用于原始任務(wù),這就是災難性遺忘。conure 提出了一個 "一個模型適用所有任務(wù)" 的學習框架,其目的是建立一個適用所有場景的用戶表征(user representation:ur)模型。在本節(jié)中,研究者通過在四個場景中遷移用戶的偏好來研究終身學習(lifelong learning ll),即從 qk-video 到 qk-article 到 qb-video 到 qb-article。
數(shù)據(jù)預處理:研究者從 qk-video-1m 隨機抽取百分之五十的用戶用于 ll 的任務(wù) 1。然后使用 qk-article、qb-video 和 qb-article 與作為其他任務(wù)的數(shù)據(jù)集。其中,qk-article 保留最多三個交互,由于 qb-video 和 qb-article 的用戶量和點擊行為較少,因此保留這兩個數(shù)據(jù)集的用戶的所有交互。
baseline 模型:在該任務(wù)中,研究者將 conure 的方法應(yīng)用在 nextitnet 和 sasrec 上。
實驗結(jié)果:表 8 顯示了用持續(xù)學習的用戶表征進行推薦的結(jié)果。可以清楚地看到,因為在任務(wù) 1 的預訓練,conure 在任務(wù) 2、3 和 4 上提供了性能改進。
8、model compression
模型壓縮可以將大型神經(jīng)模型部署到容量有限的設(shè)備中,如 gpu 和 tpu(張量處理單元)。對于推薦系統(tǒng)模型來說,嵌入層的參數(shù)數(shù)量很容易達到數(shù)億到數(shù)十億的級別。
數(shù)據(jù)預處理:研究者對 session-based recommendation 任務(wù)中的模型進行參數(shù)壓縮,并使用與 session-based recommendation 任務(wù)相同的數(shù)據(jù)集。
baseline 模型:該任務(wù)中將 cprec 框架應(yīng)用在 nextitnet 和 sasrec 上。
實驗結(jié)果:表 9 顯示 cprec 將 nextitnet 和 sasrec 壓縮到其原始大小的三分之二。
9、model training speedup
這項任務(wù)的目的是加速層數(shù)非常多的模型的訓練過程。與淺層的 ctr 模型不同,sbr 模型層數(shù)可以更深。為了加速訓練過程,他們提出了 stackrec,它首先學習一個淺層模型,然后將這些淺層復制為深層模型。同樣地,研究者通過使用 nextitnet 和 sasrec 作為骨架來評估 stackrec 框架。
數(shù)據(jù)預處理:數(shù)據(jù)集使用和預處理方式與 session-based recommendation 任務(wù)相同。
baseline 模型:該任務(wù)中將 stackrec 框架應(yīng)用在 nextitnet 和 sasrec 上。
實驗結(jié)果:表 10 顯示了訓練加速的結(jié)果??梢缘贸鰩讉€觀察結(jié)果:(1) stackrec 明顯減少了 nextitnet 和 sasrec 的訓練時間;(2) 訓練加速并沒有導致推薦精度的下降。
10、model inference speedup
隨著模型層數(shù)地增加,會出現(xiàn)一個問題:推理成本也大大增加。導致在線推理的高延遲。然而實際場景中,推薦系統(tǒng)中的用戶可以分為困難用戶和容易用戶,向容易用戶推薦物品不需要通過整個網(wǎng)絡(luò)。因此,可應(yīng)用 skiprec 框架。在模型推理階段,它可以自適應(yīng)地決定哪個用戶需要哪個層。
數(shù)據(jù)預處理:數(shù)據(jù)集使用 qb-video,預處理方式與 session-based recommendation 任務(wù)相同。
baseline 模型:該任務(wù)中將 skiprec 框架應(yīng)用在 nextitnet 和 sasrec 上。
實驗結(jié)果:表 11 顯示了 skiprec 對 qb-video 的影響。我們看到 skiprec 中的跳過策略可以大大加快 sbr 模型的推理時間,例如 nextitnet 約加速 23%,sasrec 約 32%。且 32 層的 skiprec-nextitnet 依然要比 16 層的 nextitnet 的推理速度要快。
11、top-n recommendation
top-n 推薦是推薦系統(tǒng)較為經(jīng)典的任務(wù)。研究者在 qb-video 數(shù)據(jù)集上驗證 top-n recommendation。
數(shù)據(jù)預處理:過濾掉序列長度小于 10 的用戶,并且按照 8:1:1 的分割比例劃分訓練集、驗證集和測試集。另外,采用隨機采樣和頻率采樣作為負采樣方法。
baseline 模型:在該任務(wù)中使用 mf,ncf,ngcf 和 light gcn 模型。
實驗結(jié)果:實驗結(jié)果表明,一個更好的負采樣器有助于提高準確率,例如頻率采樣。
結(jié)論
本文向讀者介紹了 tenrec,目的是推動推薦系統(tǒng)社區(qū)的發(fā)展。它是目前最大和最通用的推薦數(shù)據(jù)集之一,涵蓋多個具有各種類型用戶反饋的真實場景,用戶反饋行為包括點擊,點贊,分享,關(guān)注和真實負反饋等。并且研究者呈現(xiàn)了十一個熱門推薦系統(tǒng)任務(wù)的經(jīng)典算法在 tenrec 上的實驗結(jié)果,tenrec 可用于 ctr 預測、序列推薦、多任務(wù)學習、遷移學習、用戶畫像預測、冷啟動推薦、終身學習、模型壓縮、模型訓練加速、模型推理加速和 top-n 推薦等相關(guān)任務(wù)研究。除了上述任務(wù)以外,tenrec 還可以應(yīng)用于交叉領(lǐng)域推薦,用戶不同反饋的遷移和不同負采樣的 items 推薦等任務(wù)。tenrec 經(jīng)過數(shù)據(jù)脫敏處理,用戶的個人信息隱私問題得到了很好的保護。
? the end
轉(zhuǎn)載請聯(lián)系本公眾號獲得授權(quán)
投稿或?qū)で髨蟮溃篶ontent@jiqizhixin.com
中國云計算產(chǎn)業(yè)發(fā)展前景與投資戰(zhàn)略分析:作為工信部云計算標準委員會的主要成員,百度還參與了中國云計算的標準制定,并在科技部863云計算關(guān)鍵技術(shù)與系統(tǒng)(一期)重大項目中,承擔了網(wǎng)絡(luò)操作系統(tǒng)研制和互聯(lián)網(wǎng)語言翻譯系統(tǒng)研制兩個重要課題。
(2)電子政務(wù)市場競爭格局由于電子政務(wù)應(yīng)用的特殊性,國外廠商 ibm、sap、oracle 等廠商涉足較少,國內(nèi)軟件服務(wù)企業(yè)成為電子政務(wù)的主要業(yè)務(wù)應(yīng)用軟件供應(yīng)商,如山東浪潮齊魯軟件產(chǎn)業(yè)股份有限公司、同方政務(wù)系統(tǒng)科技有限公司等
中國云計算重點工程計劃發(fā)展情況分析北京“祥云工程(一)“祥云工程”具體措施分析“祥云工程”具體措施包括以下三方面:(1)建設(shè)堅實一流的信息技術(shù)基礎(chǔ)設(shè)施服務(wù)平臺(iaas,“基礎(chǔ)云”);(2)扶植統(tǒng)一開放的云計算軟件開發(fā)與應(yīng)用環(huán)境服務(wù)平臺
在保證核心地圖產(chǎn)品的基礎(chǔ)上,公司在智能車載操作系統(tǒng)、混合導航引擎、手機車聯(lián)方案等產(chǎn)品線上做了深入布局,結(jié)合云端海量數(shù)據(jù)處理服務(wù),提供了面向車載領(lǐng)域最完整的、擁有完全自主知識產(chǎn)權(quán)的車聯(lián)網(wǎng)方案。
2.云計算產(chǎn)業(yè)投資機會分析最先受益產(chǎn)業(yè)分析it 基礎(chǔ)設(shè)施包括服務(wù)器、存儲、網(wǎng)絡(luò)等硬件設(shè)備,操作系統(tǒng)、虛擬化、it 系統(tǒng)運維監(jiān)測等方面的軟件,以及系統(tǒng)集成服務(wù)。
和聯(lián)合國對話的機會來了!:今天,聯(lián)合國駐華系統(tǒng)宣布和騰訊共同啟動“中國青年對話未來”系列活動,將向所有的中國青年開放報名。 要做什么?
作為聯(lián)合國與青年之間重要的對話交流活動,大家將有機會圍繞科技和文化等主題分小組來探討,通過騰訊會議向聯(lián)合國駐華系統(tǒng)提交針對消除貧困、保護地球等社會問題的創(chuàng)新解決方案。
“中國青年對話未來”系列活動 “中國青年對話未來”系列活動將面向聯(lián)合國2030可持續(xù)發(fā)展目標,例如消除貧困、保護地球、文化傳承等等,希望能激發(fā)和支持青年積極思考,理性表達,成為實現(xiàn)可持續(xù)發(fā)展目標的重要推動力
(左滑查看,立即預約報名) 詳細的招募細則,將在5月底的正式報名時公布。 期待各位青年的參與。 也許你的一個小想法,能影響77億人的未來。 ?
聯(lián)合國駐華系統(tǒng) 聯(lián)合國駐華系統(tǒng)由24個聯(lián)合國駐華基金、計劃署規(guī)劃署和專門機構(gòu)組成。 聯(lián)合國駐華機構(gòu)與各級政府和非政府伙伴合作,支持政府落實國家發(fā)展目標以及各國商定的共同發(fā)展目標,包括可持續(xù)發(fā)展目標。
【pony.ai無人車隊廣州正式上路】樓教主攜手廣汽,打造“世界級智駕公司”:作者:常佩琦【新智元導讀】今天,小馬智行pony.ai與廣汽集團達成戰(zhàn)略合作伙伴關(guān)系,推出了全國第一支城區(qū)運營白天黑夜全場景無人駕駛車隊,正式在廣州南沙上路。
此次正式上路由南沙區(qū)政府出發(fā),拐入南沙主干道路鳳凰大道,途徑風景優(yōu)美的沿河蕉西路,最后到達燈光節(jié)的舉辦地市民廣場,為廣大市民體驗最新的駕駛技術(shù)提供便利。
james peng也充滿信心,“小馬智行世界級的軟件研發(fā)實力,結(jié)合廣汽集團世界級的硬件實力和車輛技術(shù),雙方一定能研發(fā)出世界一流的智能駕駛系統(tǒng)?!?政府支持+投資者青睞,打造“世界級智能駕駛公司”在廣州“iab”計劃以及南沙區(qū)管委會對人工智能產(chǎn)業(yè)的大力支持下,小馬智行表示,要在南沙持續(xù)發(fā)力,成立人工智能研究院和無人駕駛展示中心;與激光雷達公司velodyne
小馬智行也得到了資本的青睞,于一月份剛剛完成了a輪融資,融資金額為1.12億美元,是目前國內(nèi)無人駕駛初創(chuàng)公司的最高a輪融資紀錄。?
解讀美國國會關(guān)于opm數(shù)據(jù)泄露事件的調(diào)查報告:);2014年10月,在fbi發(fā)出“美國大量政府和商業(yè)公司正遭受網(wǎng)絡(luò)間諜攻擊”的警告后,攻擊者從opm網(wǎng)絡(luò)中轉(zhuǎn)移到了存儲有opm竊取資料的美國內(nèi)政部doi數(shù)據(jù)中心;2014年12月,攻擊者從內(nèi)政部doi
當前,很多政府機構(gòu)嚴重依賴第三方承包商進行信息系統(tǒng)維護,存在很多潛在安全風險,比如,承包商公司員工可以以政府雇員身份使用未授權(quán)的認證登錄進入政府網(wǎng)絡(luò)系統(tǒng),當然這也就不難理解造成opm數(shù)據(jù)泄露事件的原因。
2004年8月簽發(fā)的國土安全12號總統(tǒng)令(hspd-12),要求政府機構(gòu)在簽發(fā)和使用聯(lián)邦個人身份驗證智能卡證書時必須遵循特定的技術(shù)標準和業(yè)務(wù)流程,包括驗證員工和承包商身份所需的標準化背景調(diào)查。
在2005-2007年間的opm督察辦審計年報中都對信息系統(tǒng)存在的漏洞進行過識別。在2008年的半年國會報告中,opm督察辦承認保護敏感信息和個人身份信息的長期必要性。
年9月,opm督察辦報告聲稱opm的信息安全狀況正在惡化;2010年初,opm督察辦繼續(xù)對opm信息安全狀況表示“嚴重擔心“; 2012年,opm把信息安全業(yè)務(wù)集中劃歸給首席信息辦(ocio)承擔,2012
轉(zhuǎn)載請注明出處,本站網(wǎng)址:
http://www.dblinkclub.com/news_2062.html