
發布
注冊
/
登錄杰卡德相似性指數的案例
利用爬蟲自動計算知網文獻引用次數的杰卡德相似性指數
背景介紹
Jaccard相似指數用來度量兩個集合之間的相似性,它被定義為兩個集合交集的元素個數除以并集的元素個數,值為0表示無相關性,值為1表示完全一致。對于兩篇論文a和b來說,如果用A表示a的被引用次數,用B表示b的被引用次數,則AB的杰卡德相似指數為:
從而,如果需要得到AB的杰卡德相似指數,我們只需要知道A、B以及a和b的共引用次數,其中A或者B可以通過知網的這個頁面查看:
獲取a和b的共引用次數比較麻煩,需要選中兩篇文獻再進行分析得出,如下圖所示:
如果需要求得文獻數目比較少,手動點擊也是ok的,可是如果需要對某個數據集(例如給定的100篇文獻)來進行求解,則會異常麻煩,這時候就需要用到咱們的爬蟲技術咯~~
二。代碼介紹
開發工具組合采用的是pycharm+requests組合進行爬蟲,另外還用了pandas+chardet以及python自帶的一些庫。首先F12打開前端代碼,找到我們需要的數據,然后用以下函數獲取該數據:
之后,再對數據進行加工處理既可以完成。
最后,歡迎有爬蟲需求的小伙伴或者擅長爬蟲的小伙伴關注我們的微信公眾號聯系我們。
公眾號:320科技工作室
展開 Doc2Vec Model---段落相似性查詢
Data Mining---巖土工程的數據挖掘
畢設訓練(4): 巖石邊坡工程大數據系統設計
一個快速的句子和段落相似查詢方法
使用WMD Similarity確定句子之間的相似度
畢業論文查重就是一個坑
使用Transformers確定句子之間的相似度
力學就業與段譽愛情的相似性
力學的就業與段譽的愛情故事也有很大的相似性。在《天龍八部》中,段譽一共經歷了3段愛情,先是在無量山與鐘靈相識、一起出生入死;后到萬劫谷(鐘靈家)求救,因借馬與木婉清結交;后被鳩摩智擄去前往燕子塢,認得王語嫣,自此如癡如醉!鐘靈俏皮可人、木婉清新月清暉、王語嫣仙氣飄飄,都對段譽心生愛慕,無論段譽與誰結合,都可謂是天造地設。
然而,金庸先生卻讓段譽的感情一波三折。隨著劇情發展,鐘靈的身世揭開,竟然是段譽同父異母的妹妹;同樣,木婉清也是段譽同父異母的妹妹;如癡如醉愛慕的王語嫣,最后,還是他同父異母的妹妹。就在我們感慨段譽的愛情都是孽緣的時候,劇情再次翻轉,他不是自己父親的兒子,這些女子想娶那個就娶那個。
對力學就業的認識也有類似的翻轉。提到力學專業的就業,大多數老師會說力學專業的畢業生可以到土木、機械、航空、道橋等相關專業領域就業,咋一聽起來力學具有非常廣泛的就業領域。但是當學生真正到了就業的時候,又會發現土木、機械、航空、道橋這些行業都有自己的專業教育,每年都有大量的畢業生等待就業,這時學生又會覺得力學在這些行業中都是外來者,力學去就業都不十分對口。
這特別像段譽愛情發展的第一階段,最一開始都給人以美好的向往,然后很快都又因實際情況而破滅。幸好段譽的愛情有再次翻轉,幾位女子娶那一個都可以,實際上,如果學好了力學、利用好力學,力學確實可以到任何一個專業領域中去就業。
關于力學的作用,我們可以回顧新中國建國之初的兩件事。新中國建立之初,基礎工業薄弱,百廢待興。然而由于冷戰思維,歐美等發達國家對我國實行技術封鎖,毫不夸張的說,當時的工業建設大多是具有開創性的。由于各類工業建設中都不可避免的需要結構設計、分析、校核,就顯現出了工業建設對力學人才的迫切需求。
展開 基于Matlab的圖像相似性比較的算法介紹
基本概念
圖像相似度計算就是對兩幅圖片之間內容的相似程度進行打分,根據分數的高低來判斷圖像內容的相似程度,這也是圖像分類的基礎。如下面這幅圖像的兩位人頭虎身獸,用不同的算法進行相似度計算,相似度在60%~87%之間~~
二。算法總結
計算圖像相似度的算法有很多,常見的有以下幾種:
1。基于直方圖。直方圖能夠描述一幅圖像中顏色的全局分布,是一種入門級的圖像相似度計算方法。該算法計算過程很容易理解,首先對于兩幅圖像分別計算其直方圖,然后根據某種衡量標準進行比較,比較結果即為兩幅圖像的相似度。這種方法精度較差。
2。SSIM(結構相似性度量)。這是一種全參考的圖像質量評價指標,分別從亮度、對比度、結構三個方面度量圖像相似性。SSIM取值范圍[0, 1],值越大,表示圖像失真越小。在實際應用中,可以利用滑動窗將圖像分塊,令分塊總數為N,考慮到窗口形狀對分塊的影響,采用高斯加權計算每一窗口的均值、方差以及協方差,然后計算對應塊的結構相似度SSIM,最后將平均值作為兩圖像的結構相似性度量,即平均結構相似性SSIM。該方法通常用來衡量一張圖片壓縮后的失真度,比較少的用來計算兩圖的相似度。
3。cosin相似度(余弦相似度)。把圖片表示成一個向量,通過計算向量之間的余弦距離來表征兩張圖片的相似度。該方法運算量較大,但準確率尚可。
4。基于互信息(Mutual Information)。通過計算兩個圖片的互信息來表征他們之間的相似度,如果兩張圖片尺寸相同,還是能在一定程度上表征兩張圖片的相似性的。但是,大部分情況下圖片的尺寸不相同,如果把兩張圖片尺寸調成相同的話,又會讓原來很多的信息丟失,所以很難把握。經過實際驗證,此種方法不夠穩定。
展開 
幾何相似性搜索——讓大海撈針成為可能!
幾何相似性搜索
CADENAS戰略性零部件數據管理系統PARTsolutions幾何相似性搜索功能可以對CAD模型進行搜索和比較.
搜索項可以來自供應商產品目錄, 自制件, 重復件或企業標準,也可以是在CAD系統創建的3D模型, 搜索方式如同搜索引擎一樣在當前零部件數據庫中進行搜索。搜索結果根據同搜索項3D CAD模型的相似度進行排序列表顯示.
幾何相似性搜索,對零部件進行快速查找和細微比較。
但在機械設計中,如果錯選了某些外表相似而功能迥異的零部件,后果可能就要嚴重得多。
圖文翻譯:通過各種比較選項快速識別“冒牌貨”
PARTsolutions的幾何相似性搜索按照CAD幾何形狀,對零部件進行快速查找和細微比較。
那些乍看之下極其相似的零部件,卻不一定能實現相同的功能。在設計中如果錯選了“杜鵑蛋”會帶來巨大的麻煩。而CADENAS的幾何相似性搜索GEOsearch可以有效地避免這種情況的發生。
無論是產品目錄中的某個零部件、自制件、重復件、工廠標準件,或是一個在CAD系統中畫的3D模型草圖,都可以作為參數,通過戰略性零部件數據管理系統PARTsolutions,如使用搜索引擎一般對零部件數據庫所有現有CAD組件進行搜索。并將搜索結果按幾何相似度進行排序,以列表形式呈現。
GEOsearch提供了多種零部件比較方法
除了手動啟動GEOsearch功能外,在PARTsolutions中還可以選擇在搜索零部件時自動顯示相似的組件。 對此還提供了多種比較方法。 例如疊加比較,橫截面比較或差異比對。 這樣,可以精確對比參數零部件與找到的零部件之間的相似度。
CADENAS為零部件的智能查找開辟了全新的可能性,用戶可以對標準件、外購件和自制件的產品信息以及CAD數據進行輕松查找。而且該功能還專門針對工程師和采購商的需求進行了全面優化,通過直觀的操作智能地找到所需的組件。
展開 使用非排干脆性指數粗略估算靜態液化(undrained brittleness index)
本文簡要討論了使用非排干脆性指數評估靜態液化(undrained brittleness index)。
2. 非排干脆性指數
非排干脆性指數IB是Bishop(1971)提出的一個概念,用來評價土的靜態液化。IB=土的屈服強度(峰值強度)減去土的液化強度(殘余強度),然后再除以土的屈服強度,如下式表示。
IB的值域范圍是[0,1],IB=1意味著土呈現出非常高的脆性,強度完全失去,而IB=0意味著土在應變過程中沒有失去強度。
3 靜三軸壓縮試驗驗證
靜三軸壓縮試驗與【Duncan-Chang雙曲線模型的材料參數(Hyperbolic Material Model)】中描述的試樣相同,取自1#尾粉土,圍壓Sigma3分別為100kPa, 200kPa, 300kPa和400kPa。從圖中可以看出,沒有明顯的應變軟化趨勢,IB的值趨于0,因而可以推斷出尾粉土的靜態液化可能性不大。
一些研究者也提出了更精細的關系式來計算IB,例如:
4 CPT驗證
一些研究者使用CPT的錐頭貫入阻力估算IB,例如下式:
根據24個鉆孔的統計數據顯示,qc的最大值為6.54MPa,最小值為2.42MPa, 平均值為4.32MPa,如果按照平均值估算,IB值的范圍在0.59~0.71之間,這顯示出尾粉土有一定的靜態液化趨勢。我們正在使用一個Excel程序對全場地的CPT鉆孔進行逐一評價。
5 參考
下面的參考論文來自于GeotechSet數據集,不一定覆蓋了所有的相關文獻。
展開 技術研究|家用塑料外殼材料灼熱絲可燃性指數(GWFI)的判定方法
聚丙烯(PP)具有質輕、性能優良、耐腐蝕和易成形加工等優點,其優越性在于不僅能代替熱固性塑料和金屬,還能代替其他熱塑性塑料。環保要求家電產品節能、節水、部件可回收等,這使得聚丙烯在家電方面的應用日趨廣泛起來。對于家電殼體來說,具有高的強度(平衡的剛性/韌性性能)以及能吸引人的外觀是最重要的。Borealis 聚烯烴公司稱其推出的 PP 專用料達到 UL 94V-0 阻燃條件,適用于電視機后殼、內框和部件;Feno 公司推出高抗沖擊性、低翹曲的M PP25FU 22HB 共聚 PP,可用于生產音響的揚聲器;美國 Solar 公司用 Ferro 公司的玻璃增強PP 制造家用除草機外殼等。
家電外殼用材料,應當滿足一些阻燃性能,其中灼熱絲可燃性指數 GWFI 作為著火危險性試驗的一部分,與人們的人身財產安全息息相關,對于不可控的、不可靠的因素,需要尤其注意。筆者對改性阻燃聚丙烯樹脂(LDP-3008 P9W)進行灼熱絲可燃性指數(GWFI)測試,研究樣板燒至開裂或兩半時的火焰熄滅時間與樣板尺寸和灼熱溫度的關系,以期提高 GWFI 測試結果及判定的準確性和科學性。
1 、實驗
1.1 材料和儀器
改性聚丙烯樹脂 PP;
灼熱絲試驗機,測量溫度范圍:室溫~1 000℃。
展開 GWIT灼熱絲阻燃劑可燃性指數灼熱絲測試標準和誤區 !!
GWIT灼熱絲阻燃劑可燃性指數灼熱絲測試標準和誤區,過灼熱絲實驗和普通的UL94垂直燃燒試驗有所不同,灼熱絲沒有明火,抑制燃燒的利器不是靠滴落帶走熱量,而是靠成炭形成保護層阻止燃燒
1. 灼熱絲起燃性溫度GWIT——glow-wire ignition temperature
定義:比“連續三次試驗均不會引起規定厚度的試驗樣品起燃的灼熱絲頂部最高溫度高25K(900℃~960℃之間高30K)”的溫度。
記錄方式:
例,3mm厚的試驗樣品,試驗溫度為725℃,則記錄為:
GWFI:750/3.0 (注意:750℃=725℃+25℃)
2.灼熱絲可燃性指數GWFI——glow-wire flammability index
定義:一個規定厚度的試驗樣品在連續三次試驗中的最高試驗溫度,應滿足以下條件之一——a) 在移開灼熱絲后的30秒內試驗樣品的火焰或灼熱熄滅,并且放置在試驗樣品下面的包裝絹紙沒有起燃;b) 試驗樣品沒有起燃。
記錄方式:
例,對3mm厚的試驗樣品,試驗溫度為850℃,則記錄為:
GWFI:850/3.0
也就是說,在我們跟客戶談到材料GWIT750°是否能過的時候。設備的溫度應該是725°,檢測要保證材料不起火則為通過。GWIT談的是對材料性能要求。
而GWFI 則是指材料本生存在的特性,且溫度與實驗溫度一致。
展開 淺談膠質層指數對單種煤結焦性評價及在搗固配煤中的指導作用
武偉偉
(河北華豐能源科技發展有限公司,河北邯鄲 056300 )
摘 要:膠質層指數可以表征膠質體的數量和性質,而膠質體數量及性質的差異影響焦炭質量的優劣。本文通過搗固煉焦生產實踐,重點介紹如何合理使用膠質層指標,尤其是最終收縮度X和膠質層曲線對單種煤結焦性的評價及搗固焦爐配煤的指導。
關鍵詞:結焦性、粘結性、膠質層、正向膨脹度、膨脹、收縮、“山”型、“波”型
引 言
膠質層指數是由前蘇聯學者提出的測定煤的粘結性的方法,主要測定膠質層最大厚度Y、最終收縮度X、體積曲線類型三個指標。膠質層最大厚度Y值是我國煤炭分類和評價煉焦用煤及配煤煉焦的主要指標。然而煤的膠質層最大厚度Y值只能表示膠質體的數量而不能反映膠質體的質量。但通過不同煤種的曲線類型結合其結焦性能指標可以看出,煤的膠質層曲線形狀的差異,導致結焦性能的差異,能夠很好的反映膠質體質量的好壞。最終收縮度X對搗固煉焦生產中推焦是否順利有重要參考價值。所以我們需要對膠質層指數的三個指標進行綜合運行,全面考慮,合理的進行使用,便于對單種煤結焦性評價和指導搗固焦爐配煤。
1、膠質層指數的優勢
我公司評價單種煤粘結性和結焦性能指標有:粘結指數、膠質層厚度、基氏流動度、小焦爐試驗等。每個指標對研究煤的特性各有側重,其中粘結指數主要測定煤的粘結性,側重對惰性物的容納能力,加和性較差;膠質層最大厚度主要測定膠質體的數量,無法表征膠質體質量;小焦爐試驗主要測定煤的結焦性能,但實驗周期較長,實驗過程要求嚴格,誤差較大,需多次試驗;基式流動度表征煤的塑性,研究煤的流變性,可同時反映膠質體的數量和性質,但測定試驗的規范性很強,數據偏差很大時,容易誤導使用者。
展開