วันเสาร์, ธันวาคม 06, 2008

Google Hack เก็บข้าวของ เตรียมตัว Hack กันเลยยยย!!!!!



สวัสดีปีใหม่ 2552 ทุกท่าน หลังจากไม่ได้อัพเดตมานาน วันตอนนี้เราก็จะมาพูดเรื่อง การทำงานของ Google กันเลยครับ



เบื้องหลัง Google
เป็นข้อมูลสำคัญที่เราๆพลาดไม่ได้เลยนะครับ เพราะถ้าเข้าใจการทำงานของ กูเกิล เราก็จะเข้าใจ และเห็นภาพรวม เดี๋ยวคุณก็จะมาถามผมอีก เช่น

"หน้าแคชเพจ หรือหน้าที่ Google เก็บไว้คืออะไร?"

"แมงมุม โรบอท ของ Google เป็นยังไง?"

ฯลฯ
.......

ก็เลยต้องมาอธิบายไงครับ

ระบบการทำงานของ Google หรือ Search Engine อื่นๆ จะมี 3 ส่วนหลักๆ ดังนี้-

1. หน่วยค้นหาของมูล (ภาคส่ง)

ในหน่วยนี้จะเป็นโปรแกรมเล็กๆ ที่ชื่อว่า Search Engine Robots บ้างครั้งก็เรียกว่า Spider หรือ Crawler ในสายตาของฝรั่งก็หมายถึง แมงมุมที่ไต่ไปตามลิงค์ในหน้าเว็บ เพื่อคัดลอกหน้าเว็บทั้งหน้าแล้วส่งไปให้ เครื่องแม่ข่ายนั้นเอง โดย Google จะเรียกแมงมุมของตัวเองว่า "Googlebots" ซึ่งตอนนี้ก็พัฒนาเป็นรุ่น Googlebots 2.1 แล้ว

2.หน่วยจัดเก็บข้อมูล (ภาครับ)

ก็คือเครื่องแม่ข่าย หรือ Server ที่จะเป็นเครื่องคอมพิวเตอร์ที่มี Hard Disk จำนวนมาก ไว้เก็บข้อมูลจำนวนมหาศาลจาก แมงมุม ซึ่งในขณะนี้ Google มีเครื่อง Server จำนวน 300,000 up ครับ

โดย Google นั้นใช้ระบบปฏิบัติการทั้งหมดเป็น Linux ทั้งระบบเลยครับบบบบ ซึ่งจำนวน Server ที่มีมากมายขนาดนี้มักจะเรียกว่า Server Farm ครับ

3.หน่วยประมวลผลและแสดงผลการค้นหา (ภาคแปลกประหลาด พิสดาร เอ๊ยยยย!!!!!! ภาคแสดงผล ต่างหาก 555+)

หรือชื่ออย่างทางการคือ "หน่วยประมวลผลและจัดอับดับ" หรือ Search Engine Algorithm

จากคำพูดที่ว่า "โรบอทจะคัดลอกหน้าเว็บเพจที้งหน้า และส่งกลับมาที่ฐานข้อมูลเพื่อรอการประมวลผล" หมายความว่า หน้าเว็บที่ติดอับดันใน Google ไม่ใช้หน้าเว็บในขณะนี้เสมอไป

อาจจะเป็นหน้าเมื่อ 3-4 วันก่อน หน้าเมื่อ 2 สัปดาห์ที่แล้ว หรือ เป็นเป็นนานเป็นครึ่งปีเลยก็ได้ครับ!!!!!! ยิ่งมีลิงค์มาหาน้อยเท่าไร ยิ่งมีโอกาสที่โรบอทจะมาเก็บข้อมูลใหม่น้อยลงเท่านั้น!!!!!

ส่วนเนื้อหาในตอนต่อๆไปผมจะบอกวิธีการเปิดหน้าเว็บที่ถูกเก็บบนกูเกิลเองครับ และวิธีสังเกตความเก่าใหม่ และความถี่ที่ Googlebots มาเก็บข้อมูลของหน้าเว็บนั้นๆ

แล้ว Googlebots หน้าตาเป็นอย่างไร? ก็อย่างที่ผมบอกไป มันเป็นแค่โปรแกรมเล็กๆ โปรแกรมหนึ่งเท่านั้นเอง(รึ) แต่ก็ยังมีฝรั่งมือดีมาวาดภาพมันให้เราดูคร้าบบบบ....

สถานที่ตั้งจริงๆ ของ Google ประเทศไทย

ก่อนอื่นเลยขอให้เพื่อนทุกคนได้เปิด http://www.google.co.th/ หรือ Google ประเทศไทยขึ้นมาก่อน เห็นอะไรไหม ไอ้กูเกิ้ล ที่มาโผล่อยู่หน้า web browser ของเพื่อนๆ นั้นคือ Google ประเทสไทย แต่ตัวหน้าเว็บของมันจริงๆ นั้นอยู่บน Sever ที่ห้องกรง เอ๊ยยยย...... ฮ่องกง นะคร้าบบบบ....

เจ้า Google.co.th ที่มาปรากฏหน้าเพื่อนๆ นั้นจะมาปรากฏเมื่อมีการเรียกใช้จากประเทศไทยครับ ถ้าเพื่อนๆ ไปใช้ Google ที่ญี่ปุ่น หรือ เกาหลี Google ที่มาโผล่ต่อหน้าเพื่อนจะเป็น Google ของ ญี่ปุ่น หรือ เกาหลี นั้นเอง..... เอ๊ะแต่ถ้าเราไปเล่นเน็ตที่ ประเทศนั้นยังไม่มี Google ประจำเว็บนั้นล่ะ? ไอ้ Google ก็จะจะเราโยนไปที่ Google.com ตัวหลักทันที

ส่วนประกอบลับ ของ Google.co.th


ท่านสามารถคลิกที่รูปเพื่อดูรูปขนาดใหญ่ได้

1.แท็บหมวดหมู่การค้นหาต่างๆ
เอาไว้สลับหมวดหมู่การค้นหาต่างๆ แค่การคลิกเท่านั้น!!!!!

  • เว็บ ก็คือการค้นหาเว็บไซต์ทั่วๆไป

  • รูปภาพ จำตอนที่ Googlebots มาสำรวจเว็บได้มั้ย? ตอนนั้นแหละที่ Googlebots ได้เก็บรูปมาด้วย ตรงนี้เองทำให้มีระบบค้นหารูป เพื่อใช้ประโยชน์จากฐานข้อมูลรูปให้ได้มากที่สุด

  • กลุ่มข่าว เอาไว้จับกลุ่มคุยเรื่องที่น่าสนใจเรื่องใดเรื่องหนึ่ง แบบสภากาแฟนั้นแหละ

  • เว็บบล็อก (Blogs) เอาไว้ค้นหาบล็อกต่างๆ ที่กลาดเกลื่อนเต็มอินเทอร์เน็ต

  • สารบัญเว็บไซต์ เว็บไดเร็กทอรี่ ของ Google ที่ดึงข้อมูลมาจาก DMOZ www.dmoz.org

  • Gmail ฟรีอีเมล์จาก Google

  • ปฏิทิน โปรแกรม Microsoft Office Outlook ออนไลน์ นั้นเองครับ

  • ภาพถ่าย ค้นหาข้อมูลภาพถ่ายจากฐานข้อมูลของ Picasa Photo Album

  • Document สร้างเอกสาร ออนไลน์ แบบ Microsoft Office

  • Site บริการสร้างหน้าเว็บออนไลน์ จาก Google

  • กูรู เว็บบอร์ด ของ Google แบบ Pantip.com นั้นแหละครับ



2. ส่วนเมนูของสมาชิก
อันนี้สำหรับสมาชิกเท่านั้นนะครับ ต้องลองเข้าไปดูเอง

3.Logo
เป็นโลโก้หลักของ Google บางทีจะเปลี่ยนไปตามเทศกาล เช่น ปีใหม่ สงกรานต์ วันสำคัญทางวิทยาศาสตร์ วันบุคคลสำคัญของโลก ฯลฯ ส่วนโลโก้เก่าที่ไม่ใช้แล้วจะถูกเก็บไว้ "ข้างใน" รอบให้เรามาล้วงหากัน

4.ช่องค้นหา
ตรงนี้แหละที่เอาไว้ระบุคำสั่ง Google Hack ของเรากัน

5.ลิงค์ปรับแต่งผลการค้นหา
เพื่อให้ผลการค้นหาแม่นยำขึ้น ตอนนี้ข้ามไปก่อนแล้วกันครับ

6.ปุ่มค้นหา
คลิกที่เดียว เสียวสะท้านโลกา....

7.ดีใจจัง ค้นแล้วเจอเลย
ค้นส่วนน้อยครับ ที่จะรู้หน้าที่ของปุ่มนี้ มีถูกออกแบบมาเพื่อกด (รู้แล้วไม่ต้องบอก!!!!) และเป็นทางลัดของการค้นหา โดยเมื่อกดลงไป Google จะนำเราไปยังเว็บที่มีผลการค้นหาอันดับหนึ่งทันที!!!!! โดยไม่ต้องผ่าน หน้าแสดงผลการค้นหาครับบบ....

8.ปุ่มขอบเขตของการค้นหา
เจ้าปุ่มนี้เป็นตัวกำหนดของการค้นหา ดังนี้ครับ-

  • เว็บ ค้นหาเว็บไซตืทั่วโลก ทุกภาษา
  • หน้าที่เป็นภาษาไทย ค้นหาหน้าเว็บจากทุกมุมโลกที่เป็นภาษาไทย
  • หน้าของประเทศไทย ค้นหาหน้าเว็บที่มาจากประเทศไทยเท่านั้น (Made in Thailand) 555+


เอ... แล้วท่านทราบไหมครับว่า Google ใช้อะไรบอกว่า หน้าเว็บนี้เป็นของไทย เป็นของฝรั่ง เดี๋ยวผมจะบอกทีหลังครับ อดใจรอสักครู่

9.Switch Language ปุ่มภาษาสวิซ... เอ๊ยยยย ปุ่มสลับภาษา
หากคลิกแล้วหน้าตาของ Google.co.th จากภาษาไทยจะกลายเป็นภาษาอังกฤษทั้งหน้าครับ แล้วเจ้าปุ่มนี้กลายเป็นภาษาไทยแทน ไม่เชื่อก็ลองดูซิครับบบบบ......

10.เกี่ยวกับ Google
หากคลิกเข้าไปจะเป็นข้อมูลของบริษัท Google ในเชิงธุรกิจ แต่ไม่ได้หมายความว่าจะไม่มีอะไรให้เข้าไปดูนะครับ แต่ตอนนี้เราข้ามไปก่อนแล้วกัน

11.ประตูสู่ Google.com ที่อเมริกา
ทีเด็ดเลยครับ ตามชื่อเลย และเจ้าลิงค์นี้จะมีประโยชน์ตอเรามากมายมหาศาลเลยครับ

เรื่องจริงผ่านจอ หน้าแสดงผลการค้นหาของ Google



ท่านสามารถคลิกที่รูปเพื่อดูรูปขนาดใหญ่ได้

1.อันดับผลการค้นหา หากเราไม่ได้ปรับแต่งอะไรจะมีแค่ 10 อันดับ โดยมาตรฐานครับ แต่เราสามารถปรับแต่ไปจนถึง 100 อันดับได้เลยครับ แต่ผมว่ามันไม่จำเป็นครับ เพราะยิ่งตั้งเยอะ ยิ่งโหลดนานครับ


2.จำนวนผลการค้นหาทั้งหมด ที่ Google เจอในฐานข้อมูลครับ ซึ่งตัวเลขนี้ใช้ชี้วัดปริมาณ Keyword ของเราที่เราค้นหาได้ แต่เอาไปใช้ในเชิงวิชาการไม่ได้ครับ

3.Keyword ของเราที่ใช้ค้นหาเอง บางทีมันก็เปลี่ยนเป็นลิงค์ เพื่อให้เราคลิกเพื่อค้นหา Keyword นั้นๆได้โดยตรงเลย


4.เวลาในการค้นหา เป็นเวลาที่ใช้ในการค้นหาข้อมูลในฐานข้อมูล ก็ไม่ค่อยมีประโยชน์อะไรนัก เหมือนกับโชว์ประสิทธิภาพมากกว่าครับ

5.Pay Per Click Result หรือ PPC หรือ ส่วนแสดงโฆษณาของผู้มาลงโฆษณาครับ จะเป็นสีเหลือง หรือสีฟ้า (ใน Google.com) อ่อน และคำกำกับว่า "ลิงก์ผู้สนับสนุน" โดยเจ้าของเว็บนั้นๆมาลงโฆษณาที่ Google โดยให้โฆษณาของตัวเองแสดงขึ้นตาม Keyword ที่เขากำหนดเองครับ โดยเยตังค์ตามครั้งที่คลิกครับ ไม่มีใครคลิกไม่ต้องจ่าย


6.Pay Per Click Result อีกอัน หรือที่เรียกว่าผลการค้นหาทางฝั่งขวา ซึ่งเหมือนกับอันบน แต่ต่างที่ผู้ลงโฆษณานั้นไม่มีคะแนนพอที่จะแสดงในส่วนที่ 6


8.ผลการค้นหาฝั่งซ้ายมือ หรือ Organic or Natural Result คือผลการค้นหาที่ออกมาจากระบบประมวลผล Google Algorithm จริงๆ มีการบอกขนาดไฟล์ด้วย ไฟล์หน้าเว็บเล็กมักจะทำผลงาน (อันดับ) ได้ดีกว่าหน้าเว็บใหญ่ๆจริงๆ

9.หน้าที่ถูก เก็บ!!!! ไว้ จำได้ไหมครับ ตอบที่ Googlebots มาเก็บหน้าเว็บเพจแล้วเอาไปเก็บไว้ในฐานข้อมูลในเครื่องแม่ข่ายเพื่อรอการประมวลผล นั้นแหละ!!!! หน้าเว็บที่ผมว่า


10.หน้าที่คล้ายกัน เป็นผลการค้นหาที่ Google "เชื่อว่า" มีเนื้อหาเกี่ยวข้องกัน หรือสัมพันธ์กันในเชิงชู้สาว อุ๊บบบบบ!!!!! เช่นเว็บใน Server เดียวกัน แบบอยู่ใต้ชายคาเดียวกัน อุ๊บส์ส์ส์ส์ส์ส์ส์ส์...... อีกรอบ แหม ละเอียดซะ.......

ผลการค้นหาแปลกๆ จาก กู....เกิ้ล


1.Site Link เมนูเว็บบนกูเกิ้ล

เป็นโบนัสสำหรับเว็บที่ติดอันดับมานาน และ Keyword ที่คนหากันมากด้วย Google ก็เลยมีรางวัลให้ยังที่เห็นดังภาพ





อันดับเทพ!!!! โดดเด่น!!!! ไม่เหมือนใคร!!!!!! ข้ามหน้าข้ามตาชาวบ้านเหลือเกิน สังเกตที่มีเมนูต่อท้ายครับ ทั้งชื่อ และลิงค์ตรงๆ จะใช้เงินซื้อก็ไม่ได้ รางวัลนี้ได้มาจากทุกคนที่ใช้กูเกิ้ลเท่านั้นครับ...
2.Site Alert


เมื่อ Google วิเคราะห์ว่า เว็บนี้มีความเสี่ยง อันตรายต่อผู้ใช้ คลิกเข้าไปมีหวังได้ล้างเครื่องแน่ๆ จึงได้สร้างระบบนี้ขึ้นมา ว่าเราเตือนคุณแล้ว เราไม่รับผิดชอบ







ถึงแม้ไม่มีผลต่อระบบจัดอันดับ แต่ก็ทำให้คนไม่กล้าเข้าไปอยู่พอสมควรเลยนะครับ ส่วนสาเหตุนะหรือ ผมคิดว่าส่วนใหญืมาจาก Host ติดไวรัสครับ




Google.co.th VS Google.com


1.เปิด Google.co.th และ Google.com ขึ้นมา


2.พิมพ์ Keyword คำว่า Home ลงไปในช่องค้นหาทั้ง 2

3.ลั่นไกค้นหาทันที


ดูรูปประกอบนะครับ






ดูรูปเต็มๆได้ที่ http://pahnhandsome.multiply.com/photos/album/2 ครับ




เห็นความแตกต่างอะไรมั้ยครับผลการค้นหาไม่เหมือนกัน นี้แหละครับที่ผมว่า เจ้าลิงค์ Switch to Google.com มีประโยชน์ เพราะ ถ้าต้องการหาเพลงฝรั่ง ต้องไปหาที่ Google.com ถ้าต้องการหาเพลงไทยๆ ต้องไปหาที่ Google.co.th เห็นประโยชน์หรือยังครับบบบบ..........


แล้ว Google ใช้อะไรระบุสัญชาติ?
1. IP ของ Host ที่เก็บเว็บไซต์
2.นามสกุลโดเมน เช่น .co.th .ac.th .or.th .in.th เป็นต้น
3.ภาษาหลักในเว็บไซต์

ทำได้ไง? เมื่อ Google เป็นอัจฉริยะด้านภาษา

ระบบตัดต่อคำภาษาไทย หรือ Thai Language Braking Algorithm ที่เพิ่งถูกเปิดตัวไม่นานมานี้มันอัจฉริยะตามคำร่ำลือจริงๆครับ ไม่เชื่อก็ลองดูครับ

ทั้งการผสมคำ การแยกคำ การแก้ไขแนะนำคำที่ถูกต้อง การค้นหาถึงรากศัพท์ หรือแม้แต่การเติมสระและวรรณยุกต์

เช่น data centor ผิมพ์ผิด ต้องเอาไปลองเองนะครับ 555+ ไม่อยากจะเอ่ย

ตัวเล็ก=ตัวใหญ่

ตอบตรงๆเลยนะครับว่า ระหว่าง S กับ s ใน Google ไม่ต่างกันเลยโดย กูเกิ้ลจะเห็นเป็นพิมพ์เล็กหมดเลยครับ ท่านก็ลองทดสอบดูก็ได้ครับ เช่น


  • sinkanok
  • SINKANOK
  • Sinkanok
มีความหมายเดียวกันครับ คือ sinkanok เหมือนกัน

คำเตือน! อย่าลืมเตรียมโปรแกรมดังต่อไปนี้!

1. โปรแกรม Anti Virus Anti Spyware อันนี้มันแน่อยู่แล้ว ถ้าคอมไม่มี ก็เหมือนคอมไม่มีภูมิคุ้มกัน โปรแกรมแอนตี้ไวรัส (ผมขอเรียกสั้นๆว่า โปรแกรมไวรัสแล้วกัน) ก็สามารถหาดาวน์โหลดง่ายๆตามอินเทอร์เน็ต หาจะซื้อมา หรือขอให้ร้านลงได้

2. โปรแกรมเล่นหนัง ฟังเพลง ดูรูป อันนี้ส่วนใหญ่จะมีติดคอมอยู่แล้ว แต่ถ้าคุณไปดาวน์โหลดไฟล์หนัง ไฟล์เพลง ของต่างประเทศ ของฝรั่ง พวกนามสกุล FLV (อันนี้ผมรู้จัก) VOB (งง????) ISO (รู้จักแต่ ISO 9001 555+) MOD (อันนี้ของกล้อง JVC แหงๆ) ผมก็ขอแนะนำ.........

K-Lite Mega Codec โปรแกรมเล่นไฟล์มัลติมีเดียครอบจักรวาลลลลล......

กับ

VLC Media Player โปรแกรมดูหนัง (หนังอะไร ผมไม่รู้...)

สองอันนี้เป็นฟรีแวร์ หาดาวน์โหลดได้ใน Google

ส่วนโปรแกรมดูรูป ผมขอแนะนำ Picasa โปรแกรมดูรูปจาก Google เองครับ แต่ถ้ามีโปรแกรมอื่น เช่น ACDSee อยู่ในคอมแล้วก็ไม่ต้องหามาลงก็ได้

อย่าลืม Google Acount

ท่านสามารถสมัครได้ที่หน้า mail.google.com แล้วมองหาคำว่า สร้างบันชีผู้ใช้เดี๋ยวนี้ แล้วก็ทำตามที่ระบบบอกนะครับ แค่นี้ จบ...

ตอนต่อไปเราจะเข้าเรื่องการใช้คำสั่ง Hack กันคร้าบ สำหรับเรื่องนี้จบแล้วครับ สวัสดีครับ

ข่าวล่าสุด

Google Hot Trends

วิดีโอ จาก Youtube

Loading...