½ நொடியில் தேடும் கூகிள்!

½ நொடியில் தேடும் கூகிள்!

நாம் தேடும் எதுவாக இருந்தாலும் சரி, கூகிள் தேடு பொறி அதை ½ நொடியில் கண்டுபிடித்துக் கொடுக்கிறதே, எப்படி என்று எப்பவாவது யோசித்துப் பார்த்தது உண்டா?  நமக்கென்னவோ ½ நொடிதான்!  நாம் தட்டச்சிடும் முக்கியச் சொல்லை வைத்துக் கொண்டு வலையதளத்தில் தேடிக் கண்டுபிடிக்க கூகிள் திரைமறைவில் எத்தனை காரியங்கள் செய்கிறது தெரியுமா?

திங்கள் அன்று கூகிள் தனது இந்த மஹா தேடு பொறியின்  இயக்கத்தின் பின்புலத்தில் இருக்கும் விஞ்ஞானம் என்ன, அது எப்படி இயங்குகிறது என்று ஒரு வீடியோ வெளியிட்டது.

கூகிளின் வெப்ஸ்பாம்( Webspam) தலைமை அதிகாரி, மென்பொருள் வல்லுநர் திரு. மேட் கட்ஸ் (Matt Cutts) யூ ட்யூப் வீடியோ ஒன்றில் இதனை விளக்கினார்.  கூகிளின் ராட்சதத் தேடும் பொறி பயனீட்டாளர்கள் தேடியதைக் கண்டுபிடிக்க வலையத்தை அனுதினமும் வலை போட்டுத் தேடுகிறது. தனது பயனீட்டாளர்களுக்கு மிகச் சமீபத்திய தரவுகளைக் கொடுக்க வலையத்தின் பதிவுகளை முழுவதுமாகக் குடைந்து குடைந்து தேடுகிறது. இது தினமும் நடக்கிறது.

திரு மேட் கட்ஸ் விளக்குகிறார்:

“இதற்கு 3 வேலைகளைச் செய்ய வேண்டும். முதலில் நிறுத்தி நிதானமாக, ஆழமாக, விரிவாக வலை வலம் (crawl the web) செய்யவேண்டும். இரண்டாவதாக கிடைத்தவற்றை  முதல் இடம், இரண்டாம் இடம் என்று  அட்டவணைப்படுத்த வேண்டும். கடைசியாக பயனீட்டாளர்கள் தேடிய விஷயத்தைப் பற்றிய முதன்மையான விவரங்களை உடனடியாக அவர்களுக்குத் திருப்பி அனுப்ப வேண்டும்”

“முன்பெல்லாம் நாங்கள் 30 நாட்கள் வலை வலம் வருவோம்; அவற்றை ஒரு வாரம் அட்டவணைப்படுத்துவோம்; அவற்றை வெளியிட மேலும் ஒரு வாரம் ஆகும். சில சமயங்களில் புதிய விவரங்கள் கிடைக்கும்; சில சமயம் பழைய தரவுகள் (datas) இருக்கும் தரவு தளத்தை அடைவோம்.”

“ஆனால் இந்த முறை அத்தனை உகந்ததாக இல்லை. ஏனெனில் கிடைத்த விவரங்கள் பல காலாவதியான விவரங்களாகவே இருந்தன. 2003 இல் கூகிள் தினசரி ஒரு கணிசமான அளவு வலை வலம் செய்யத் தொடங்கியது. இதனால் அட்டவணையை அதிக விவரங்களுடன் புதுப்பிக்க முடிந்தது.”

“போகப்போக இந்த முறை சிறந்த விளைவுகளை கொடுக்கத் துவங்கியது. எல்லா விவரங்களையும் புதிதாக வைக்க முடிந்தது. ஒவ்வொரு பக்கத்திற்கும் நாங்கள் கொடுக்கும் தர வரிசை (rank) எண்கள் நீங்கள் பார்க்க நினைக்கும் இணைப்பை நிர்ணயித்தது. அதிகத் தர வரிசை, அதிக மக்கள் பார்க்கும் இணைப்பு என்ற இவை அதிகரிக்க அதிகரிக்க நீங்கள் தேடும் தளம் விரைவில் கிடைத்து விடுகிறது.” என்கிறார் திரு கட்ஸ்.

நமக்கு வேண்டியதை தேடும் போது இன்னொரு விஷயமும் மிக முக்கியம் என்கிறது கூகிள். “அதுதான் வேர்ட் ஆர்டர் என்னும் வார்த்தை வரிசைப் படுத்துதல். உதாரணத்திற்கு நீங்கள் வித்யா பாலனைத் தேடினால் இரண்டு வார்த்தைகளும் பக்கத்துப் பக்கத்தில் இருக்க வேண்டும். இல்லாது போனால் வித்யா என்பதற்கு சில பக்கங்களையும் பாலனுக்கு அதே பக்கத்தில் வேறு பகுதிகளையும் தேடு பொறி காட்டும்.“

வலைத்தளப் பதிவாளர்களுக்கும் இது ஒரு மிகச்சிறந்த குறிப்பு.

“தேடும் வார்த்தைகளின் அருகாமை, கிடைக்கும் பக்கம் பயனீட்டாளர்கள் இடையே எத்தனை பிரபலமாக இருக்கிறது, அந்தப் பக்கத்தை சுட்டும் இணைப்புகள் இவைதான் இந்த தேடு பொறியின் வேகத்தின் ரகசியம்”.

இத்தனையும் நடந்த பிறகு தேடல் குறிச்சொற்கள் பல நூற்றுக்கணக்கான வெவ்வேறு கணிபொறிகளுக்கு அனுப்பபடுகின்றன. அவை தங்களிடம் இருக்கும் விவரங்களின் அட்டவணையை ஆராய்ந்து இருப்பதிலேயே மிகச் சிறந்த பக்கத்தை காட்டுகின்றன.

“எங்களிடம் இருக்கும் அட்டவணை முழுவதிலும் இந்த தேடுதலுக்கு எது மிகச்சிறந்த பக்கம் என்று பார்த்து அந்தப் பக்கத்தை சின்னச்சின்ன குறிப்புகளுடன் குறியீட்டு சொற்களுக்கான பின்னணியுடன் ½ நொடியில் காட்டுகிறோம்”.

இது வெறும் கூகிள் தேடு பொறியின் ரகசியம் மட்டுமல்ல; கூகிள் உலாவியின் வெற்றி ரகசியமும் கூட என்றால் மிகையில்லை.

http://www.engadget.com/2012/04/24/google-explains-how-it-searches-the-internet-in-under-half-a-sec/