SEO的藝術(shù):搜索引擎在網(wǎng)頁能“看到”什么內(nèi)容(3) |
發(fā)布時(shí)間:2018-06-27 文章來源:本站 瀏覽次數(shù):3914 |
2.2.4 搜索引擎在網(wǎng)頁上能"看到"什么內(nèi)容(3) 搜索引擎看不到的東西 搜索引擎"看"不到的內(nèi)容類型也值得研討。 例如,雖然搜索引擎可以檢測到你顯現(xiàn)一幅圖片,可是除非你在前面介紹的alt特點(diǎn)中供給了信息,不然它們無法得知圖片展現(xiàn)的是什么。它們只知道圖片中的某些基本的信息,例如,圖片上有一張臉,或許圖片是否含有色情內(nèi)容(經(jīng)過圖片中有多少肉色來判別)。搜索引擎無法得知一幅圖片顯現(xiàn)的是Bart Simpson仍是一條船,一所房子仍是龍卷風(fēng)。此外,搜索引擎也無法辨認(rèn)圖片中顯現(xiàn)的任何文本。搜索引擎正在實(shí)驗(yàn)運(yùn)用光學(xué)字符辨認(rèn)(Optical Character Recognition, OCR)從圖片中提取文本,可是這種技能還沒有得到遍及的使用。 另外,傳統(tǒng)的SEO觀念一向認(rèn)為搜索引擎無法讀取Flash文件,可是這有些夸大其詞了。搜索引擎多年前就現(xiàn)已能從Flash中提取一些信息。可是,搜索引擎不容易斷定Flash里到底有什么。最大的問題之一是,即便搜索引擎探求Flash的內(nèi)部,它們所尋覓的仍然是文本內(nèi)容,而Flash是圖形化的媒體,沒有什么因素可以唆使規(guī)劃人員在Flash中選用文本(除了對(duì)搜索引擎的好處以外)。即便HTML與Flash一同運(yùn)用,存在于HTML文本中的一切語義頭緒(例如,標(biāo)題符號(hào)、粗體文本等)也都不見了。 并且,搜索引擎看不到Flash中包括的任何圖片內(nèi)容,這就意味著當(dāng)Flash中的文本轉(zhuǎn)化為矢量輪廓時(shí),搜索引擎所能讀取的文本信息也就丟掉了。 音頻和視頻文件也不容易被搜索引擎讀取。和圖片相同,這些數(shù)據(jù)難以解析。在少量破例情況下,搜索引擎可以提取有限的一些數(shù)據(jù),例如,MP3文件中的ID3符號(hào),或許以AAC格局存在的具有嵌入式"注釋"、圖片和章節(jié)符號(hào)的改進(jìn)型播客。不過,搜索引擎畢竟無法區(qū)分足球賽和森林火災(zāi)的視頻。 搜索引擎也無法讀取程序里包括的內(nèi)容。搜索引擎實(shí)際上尋覓的是網(wǎng)頁源代碼中人們可以看見的文本,這在前面現(xiàn)已論說過。在瀏覽器加載網(wǎng)頁之后你所能看到的內(nèi)容杯水車薪,只要在頁面源代碼中可以看到和閱覽的信息對(duì)搜索引擎才有含義。 AJAX技能就是這樣一個(gè)比如,人們可以看到它所顯現(xiàn)的內(nèi)容,而搜索引擎卻無法看到。 AJAX是一種基于JavaScript的技能,用于從數(shù)據(jù)庫中獲取數(shù)據(jù),然后在不刷新整個(gè)頁面的情況下動(dòng)態(tài)顯現(xiàn)網(wǎng)頁內(nèi)容。這種技能常用于網(wǎng)絡(luò)上的一些東西,當(dāng)用戶拜訪網(wǎng)址時(shí)供給某些輸入,AJAX東西獲取并顯現(xiàn)正確的內(nèi)容。 在用戶輸入信息后,在客戶計(jì)算機(jī)(用戶計(jì)算機(jī))上運(yùn)轉(zhuǎn)的一個(gè)腳本擔(dān)任獲取內(nèi)容,這成為問題的本源。這種辦法可能形成許多不同的輸出。此外,在接收到輸入之前,內(nèi)容不出現(xiàn)在頁面的HTML中,所以搜索引擎無法看到。Google供給了樹立可爬行的AJAX使用程序的詳細(xì)技巧。 一些其他方式的JavaScript在用戶采取舉動(dòng)之前不顯現(xiàn)HTML內(nèi)容,然后形成了類似的問題。 在HTML 5中,創(chuàng)建了一個(gè)嵌入符號(hào)()結(jié)構(gòu),這種結(jié)構(gòu)答應(yīng)在HTML頁面中參加插件。插件是在用戶計(jì)算機(jī)而不是網(wǎng)站W(wǎng)eb服務(wù)器上的程序。這個(gè)符號(hào)常用于在網(wǎng)頁中刺進(jìn)視頻或許音頻文件。符號(hào)奉告插件在哪里尋覓數(shù)據(jù)文件。經(jīng)過插件包括的內(nèi)容關(guān)于搜索引擎來說徹底不行見。 結(jié)構(gòu)(frame)和iframe是在網(wǎng)頁中參加來自其他網(wǎng)頁內(nèi)容的辦法。Iframe比結(jié)構(gòu)更常用于刺進(jìn)來自另一個(gè)網(wǎng)站的內(nèi)容。 結(jié)構(gòu)一般用于切割發(fā)布者網(wǎng)站的內(nèi)容,但它也可以用于從其他網(wǎng)站加載內(nèi)容?墒,搜索引擎可以辨認(rèn)從其他網(wǎng)站拉取內(nèi)容的iframe或許結(jié)構(gòu),然后疏忽iframe或許結(jié)構(gòu)中歸于其他發(fā)布者的內(nèi)容。換句話說,它們不將從其他網(wǎng)站拉取的內(nèi)容作為獨(dú)特內(nèi)容的一部分。 |
|