Iparrorratza
Ikaskuntza, jakintza eta teknologia Image: http://s23.sitemeter.com/meter.asp?site=s23iparrorratza
Microsoften Automated Service Agent (ASA)
Hizkuntza-teknologian oinarritutako dei-zentro automatizatua Dei-zentro bat telefonoz egindako kontsultei erantzuteko bulego bat da. Kontsumitzaileek produktuen eta zerbitzuen erabileraren inguruan dituzten zalantzak, kexak, etab. jaso eta erantzutea da dei-zentroen xedea. Zenbat aldiz ez dugu etsi konpainia bateko dei-zentro batera deitu eta ez dugulako inorekin hitz egitea lortzen? "Gure operadore guztiak okupatuta daude. Itxoin ezazu mesedez edo deitu geroago" entzuten dugu eta azkenerako haserretu egiten gara. Gainera Interneten kontsultak egiten hasi aurretik geneukan pazientzia galdu dugu, bilatzaileek segundo-zati batean milaka erantzun ematen dizkigulako egindako galderari eta dei-zentroak, aldiz, astunak eta efikazia eskasekoak gertatzen zaizkigu askotan. Egoera horri erantzun nahian Microsoftek Automated Service Agent delakoa sortu du. Zerbitzu horrek Microsoften hizkuntza-teknologia erabiltzen du kontsumitzaileek egiten dituzten galderei dagozkien erantzunak datu-base batean bilatu eta eskaintzeko. Soluzioa Microsoften datu-zentroetan dago ostatatuta eta hark zerbitzu gisa saltzen die enpresei. Enpresek HTML kode-zati bat sartzen dute euren webguneetan eta horren ondorioz ikono bat agertzen da zerbitzua eskuragarri dagoela adierazten duena. Bertan klik eginez edozein kontsumitzaile zerbitzuarekin harremanetan jartzen da. Hortik aurrera robot batekin elkarrizketan hasten da kontsultagilea. Elkarrizketa modu hori ez badu gustukoa kontsultagileak ASAk antzematen dio eta erantzuteko beste era batera bideratzen du, posta elektronikora lehen urrats batean eta behar izanez gero baita pertsona batekin hizketan aritzera ere, dela txatez, dela telefonoz. 2008/05/07 - 18:29:02
OCRak eta 2D barra-kodeen dekodetzaileak sakelako telefonoetan. Etekin handia ateratzeko
moduko konbinazioak
OCRak sakelako telefonoetan OCRak, orri inprimatuen argazkiak testu-fitxategi bihurtzen dituzten programak, aspaldi irten ziren merkatura. Gogoan dut nola 1980ko hamarkadaren bukaeran, UZEIn lanean ari nintzela, XX. mendeko corpus estatistikoa osatzeko testu gehienak eskaneatu eta OCRak erabilita jaso genituen. Hori baino urte batzuk lehenago, 1974an Raymond Kurzweil izeneko asmatzaile batek Kurzweil Computer Products, Inc. izeneko enpresa sortu zuen eta edozein letra-tipo ezagutzeko gai zen lehen OCRa asmatu zuen. Orduan bururatu zitzaion tresna hori baliagarria izan zitekeela itsuei testuak irakurriko zizkien makina bat egiteko, baina horretarako beste bi baliabide behar zituen: eskaner laua eta testutik hizketarako sintetizatzailea, eta horiek ere berak asmatu zituen. 2005eko ekainean Kurzweil-ek K-NFB Reader kaleratu zuen, argazki-kamera bat eta ordenagailu bat elkartuak dituen sakelako tresna bat, itsuei testu inprimatuak ozenki irakurtzen dizkiena. Aurten, berriz, tresna horren funtzioak sakelako telefono batean jarri ditu. Erabiltzaileak argazkia ateratzen dio testuari, OCRak argazkiko testua interpretatzen du eta testutik hizketarako sintetizatzaileak irakurri egiten du. Hori gertatzen den bitartean, testua telefonoaren pantailan agertzen da eta irakurtzen ari den hitza nabarmenduta ikusten da. Nire ustez, konbinazio horrek emaitza interesgarriak emango ditu. Berez ematen hasia da. Batzuk sinpleak dira eta beste batzuk anbizio handiagokoak: 1) Txartel pertsonaletako datuak ateratzea. Telefonoaren kameraz argazki bat txartelari atera ondoren, datuak agendan gordetzen dira. Aurrerapauso handia izan da horretarako Abby etxeak atera duen ABBYY Mobile OCR SDK garapen-softwarea. Sistema horrek testua analizatzeko gaitasun bereziak eskaintzen ditu, txarteletan inprimatuta dauden izen-deiturak, telefono-zenbakiak, posta-helbideak, e-maileko helbideak eta URLak ezagutzeko. Oraingoz 13 hizkuntza hauetarako dago prestatua: txinera tradizionala eta sinplifikatua, ingelesa, frantsesa, alemana, indonesiera, italiera, japoniera, koreera, portugalera, errusiera, espainiera eta ukrainera. 2) Sakelako telefonoa hiztegi bihurtzen duen softwarea. Kameraz hartutako irudian dauden hitzak ezagutzen ditu eta erabiltzaileari esanahiak erakusten dizkio. 3) Dokumentuak sakelako telefonoaz digitalizatzeko aplikazioa, A4 tamainatik beherako orrialdeak digitalizatzeko gai dena Bi dimentsioko (2D) barra-kodeen irakurketa sakelako telefonoen bidez . 2D barra-kodeak informazioa kodetzeko era bat dira. Orain arte produktuetan inprimatuta ikusi izan ditugun barra-kodeek lerro-segida bat izaten duten bezala, 2D barra-kodeek beheko irudien itxura izaten dute. Horrelako barra-kode batean ohikoetan baino askoz informazio gehiago kode daiteke eta kamera duen edozein tresnak irakur dezake, hala nola sakelako telefono batek, hain zuzen. Kodetuta dagoen informazioa web gune baten URLa izan daiteke, esate baterako. Kameraz irudia jasotzen badugu eta kodetutako informazioa dekodetzeko software egokia baldin badugu telefonoan, honek lortzen duen informazioa nabigatzaileari helbide horretara joateko eskatzeko erabil dezake edo telefono-zenbaki bat baldin bada, hartara deitzeko. Hemen ikus daiteke nola funtzionatzen duen horrelako dekodetzaile batek. Kodeak Internet bidez ere sor daitezke, esate baterako Nokiaren web orri honetan: http://mobilecodes.nokia.com/index.htm Adibidez, nire blog honetan sartzeko kodea horrela sortu dut eta hauxe da: Hainbat formatu sortu dira 2D barra-kodeetan informazioa kodetzeko, baina gaur egun bi dira nagusiak: Datamatrix eta QRCode . Goikoa Datamatrix modukoa da, baina Nokiaren goiko web gunean, badago QRCode modukoak sortzeko aukera ere. Mundu fisikoa eta Internet lotzeko bidea Demagun zientzia-museo batean tresna edo fenomeno bakoitzari bere barra-kodea ezartzen diogula eta horretan Harluxet entziklopedian dagokion artikuluaren URLa kodetzen dugula. Adibidez, pendulua dagoen lekuari (QRCode formatuan) barra-kode hau ezarriko genioke: Horixe bera egiten da Semapedia web gunearen bidez, baina Harluxet entziklopediarekin estekatu ordez, Wikipediarekin. Orain jar gaitezen bisitariaren lekuan. Kameradun sakelako telefono bat beharko luke, Internetekin konektatzeko gai dena. Horretaz gain, 2D barra-kodeak dekodetzeko softwarea izan beharko luke telefonoan. Zenbait telefono berrik barra-kodeak irakurtzeko softwarea fabrikatik instalatuta ekartzen du, beste zenbait kasutan jaits daiteke Internetetik doan eta instala daiteke. Beste aukera bat da kamerak jaso duen irudia MMS mezu batean dekodetze-lana egiten duen zerbitzari batera bidaltzea. Zerbitzari horrek SMS mezu bat bidaliko du telefonora URLarekin. Erabiltzaileak aski du esteka onartzea eta WAP bidez edukira joko du. Pariseko metroak erabiltzen ditu dagoeneko 2D barra-kodeak Pariseko garraio publikoen RATP erakundeak bidaiarientzako zerbitzu bat jarri du sakelako telefonoen bidez irakurtzen diren 2D barra-kodeen bidez. Horretarako, bidaiariak, lehenik eta behin, aplikazio bat kargatu behar du bere sakelako telefonoan, honako helbide honetatik jaitsiz: http://www.ratpcodes2d.fr/telecharger-lapplication/ Telefono-mota bakoitzak bere aplikazioa behar du, estandarizazio-falta dela eta. Nire telefonoa Motorola L7 denez, esate baterako, modelo horri dagokion aplikazioa jaitsi behar dut. Hortik aurrera, geltokietan dauden 2D kodeei (ordutegiei dagokiena, geltokiaren inguruko planoari dagokiona, etab.) argazkia atera eta telefonoa WAP gune egokira konektatzen da informazioa erakusteko. 2008/04/11 - 15:38:04
Quebec-ek hizkuntza-industriako liderra izatea erabaki du
Quebec-eko gobernuak 4 milioi dolar inbertitu ditu Quebec-eko Unibertsitateak Outaouais-en duen campusean hizkuntza-teknologia garatuko duen zentro bat sortzeko. Outaouais delakoa Quebec-en mendebaldeko eskualde bat da. Bertan dagoen Gatineau izeneko hirian azken urteotan 80 enpresa ari dira lanean hizkuntzarekin zerikusia duten jardueratan. Quebec-eko garapen ekonomikorako ministro Raymond Bachand-ek esan du helburua Outaouais eskualdea 2020rako mundu-mailan itzulpen-teknologian liderra izatea dela. Gatineauko enpresak ondo ari omen dira dagoeneko Kanadako mailan, baina esportazioari ekin nahi diote. Urtean 5.000 milioi dolar ari dira fakturatzen eta 51.000 lanpostu sortu dituzte Kanada osoan, zuzenekoak nahiz zeharkakoak kontuan hartuz gero. Gatineaun bertan 700 pertsona ari dira lanean itzultzaileak, hizkuntza-irakasleak, software-ingeniariak eta proiektu-kudeatzaileak barne. Gatineaukoak dira JiveFusion Technologies eta Multicorpora enpresak, ordenagailuz lagundutako itzulpenerako softwarea 35 herrialdetara esportatzen ari direnak. Haiek bai eta guk zergatik ez? 2008/02/20 - 20:01:03
Alfabetatze mediatikoa eskolatan noizko?
BBC World-en IKTez jarduten den Bill Thomson kazetariak duela bi hilabete justu azaldutako zenbait ideia dakartzat hona, guztiz ados nagoelako esaten duenarekin: Irakaskuntzan gero eta gehiago erabiltzen dira IKTak eta ikasleek hezkuntza-sistematik irteten direnerako hor nonbait jakiten dute testu-prozesadoreak, kalkulu-orriak edo aurkezpenak prestatzeko programak erabiltzen. Alabaina, askoz gutxiago lantzen da medioekiko jarrera kritikoa. Ikasle gehienek badute ordenagailua etxean eta Internet erabiltzen dute eskolan ere, baina gauzak hain laster joan direnez, medioekiko gogoeta ez da iritsi curriculumera. XIX. mendeko agintariak ohartu ziren alfabetatze orokorrak dituen onura ekonomikoez eta hezkuntza-sistema orokortu zuten. Garaia iritsi da alfabetatze mediatikoari tratamendu berbera emateko. 2008/01/04 - 13:18:18
Hemezortzi hilabete barru sakelako telefonoetan terabyteko memoriak izan genitzake
Memoria-mota berri bat, PMC (programmable-metallization-cell) edo memoria nanoionikoa deritzona, garatu dute AEBetako Arizonako Estatuko Unibertsitatean eta elektronika-sektoreko zenbait enpresatan, hala nola IBMn eta Sonyn. Teknologia berri horrek flash memoriak ez ezik disko gogorrak ere ordezka ditzake, zeren eta orain erabiltzen diren biltegiratze-teknologiek baino askoz edukiera eta lastertasun handiagoak eta energia-kontsumo txikiagoa ahalbidetzen ditu. Nanoteknologian oinarritzen da aurrerapen hori, zehazki nanoionikan. Nanoteknologia nanometroen (10 -9 m) eskalan gertatzen diren fenomeno fisikoetan oinarritutako teknologia da. Material solido baten kristal-egituran hutsune asko gertatzen direnean, konposizioaren eraginez, haren barruan zenbait ioik mugikortasun handia izan dezake, are tenperatura nahikoa apaletan. Ioiek mugikortasun handia izateak esan nahi du karga elektrikoa oso erraz garraia daitekeela, elektrolito batean edo gatz urtuetan bezalatsu. Material horiei ioi-eroale lasterrak esaten zaie. Material bat ioi-eroale lasterra izateko, karga-garraiatzaileen kontzentrazio handia, egituran hutsune-kontzentrazio handia eta ioiek migratzeko aktibazio-energia txikia izan behar ditu. Material horietan oinarritzen dira litiozko bateria modernoak eta erregai-zelulak eta baita PMC memoria berri horiek ere. PMC memoria-zelula batek metalezko bi elektrodo ditu, bata tungstenozkoa eta bestea zilarrezkoa edo kobrezkoa eta bien artean, otarteko batean urdaiazpikoa egoten den moduan, elektrolito solisdozko geruza mehe bat eta kontroleko transistore bat. Elektrolitoaren barruan beste ioi metaliko batzuk ezartzen dira. Tungstenozko elektrodoari polaritate negatiboa aplikatzen zaionean, beste elektrodorantz, elektrolito solidoaren oso sekzio mehe batean zehar korronte bat hasten da. Elektrolitoko ioiak eta elektrodo positiboko beste batzuk erakarpen batek korrontearen aldera eramaten ditu. Denbora-tarte labur baten ondoren korronterantz doazen ioiek metalezko nanohari bat osatzen dute bi elektrodoen artean. Horrek bide horren erresistentzia guztiz txikiagotzen du. Erresistentzia-aldaketa hori eragitea memorian idaztea da. Irakurtzeko, berriz, kontroleko transistorea piztea eta zelulari tentsio txiki bat aplikatzea aski da. Nanoharia osatuta baldin badago, erresistentzia txikia izango da eta, beraz, korrontearen intentsitatea handia. Horren irakurketa 1 logikoaren baliokide izango da. Ostera nanoharirik ez bada osatu, erresistentzia handia izango da eta korrontea txikia. Hori 0 logikoa izango da. Zelula ezabatzeko, idazteko erabili den kontrako polarizazioa erabili behar da. Kobre-ioiak korrontetik alde egingo dute, elektrolitora eta agian kobrezko elektrodora. Nanoharia eten egingo da eta berriro erresistentzia handia izango da. Zelula batek informazio-bit bat baino gehiago ere gorde ditzake. Horretarako, nanoharia eratu denean, berriz tentsioa aplikatzen bazaio, atomo gehiago osa daitezke eta lodiera handitu, erresistentzia gutxitzeko. Hori gehiagotan ere egin daiteke eta zenbait erresistentzia-mailaren bidez, zenbait bit gorde. Horretaz gainera, geruzak gainjartzea ere posible da oso dentsitate handiko memoriak egiteko. Teknologia horretan erabiltzen diren materialak merkeak dira eta teknologia gaur egun mikroprozesadoreak egiteko erabiltzen dena berbera. 2007/12/18 - 20:03:09
Barney Pell-en hitzaldia ISWC 2007 konferentzian
Web Semantikoaren Nazioarteko 6. Konferentzia 2007ko azaroaren 11tik 15era izan da Koreako Busan hirian. Irekiera-hitzaldia hizkuntza naturalean oinarritutako Powerset bilatzailearen arduradun tekniko Barney Pell jaunak egin zuen. Hitzaldi horretan Hizkuntza Naturalaren Prozesamenduak web semantikoari egin diezaizkiokeen ekarpenez hitz egin zuen Barney Pell-ek. Erabiltzaileak informazioarekin eta zerbitzuekin ahalik eta interakziorik erosoenak eta aberatsenak izatea da Powerset-ek lortu nahi duena, horretarako Hizkuntza Naturalaren Prozesamendua eta bilaketa-teknologia konbinatuz. Powerseten indexatzaile semantikoak esanahia erauzten du dokumentuen egitura linguistikotik. Hainbat informazio-iturri tratatzen ditu: web guneak, jarioak, blogak, metadatuak, bideoak eta podcastak. Datu-baseak ere kontsulta ditzake denbora errealean hizkuntza naturaleko galderak datu-basearen kontsultak bihurtuz Barney Pell-ek Powerset-en zenbait demo erakutsi zituen: perpausak nola analizatzen dituen, entitateak eta erlazio semantikoak nola erauzten dituen, perpaus bakoitzeko hainbat egitate nola indexatzen dituen. Interesgarria izan zen ikustea nola egitate berari buruzko kontsulta desberdinen emaitzak bat zetozen eta emaitzok hainbat iturritatik, Freebase-tik eta WordNet-etik adibidez, ateratako informazioek osatzen zituzten. Xerox-en PARC laborategietan jatorria duen Powerset-en hizkuntza-teknologia gramatika lexiko-funtzionalean (LFG) oinarritua da. LFGren planteamenduaren arabera hizkuntza hainbat egitura-dimentsioz osatua da. Dimentsio horietako bakoitzak bere egitura, bere erregelak, bere kontzeptuak eta bere forma ditu. Honako egiturak aztertzen dira: funtzio gramatikalak, osagai sintaktikoak, argumentu-egitura, egitura semantikoa, informazio-egitura, egitura morfologikoa eta egitura fonologikoa. Egitura horiek guztiek elkar murrizten dute. Barney baikor azaldu zen web semantikoak izango duen garapenaren lastertasunaz eta esan zuen lau motatako partehartzaileek lortuko dutela bultzada hori ematea: 1) Eduki-argitaratzaileek, ontologiak sortuko dituztelako trafikoa handitzeko eta edukiak hobetzen lagunduko dieten feedbacka lortzeko asmoz. 2) Erabiltzaileek feedback hori emango dutelako eta ontologia txikiak sortuko dituztelako beren interesen arabera emaitza hobeak lortzearren. 3) Garatzaileek erabileremu jakinetako ezagutza-paketeak sortuko dituztelako. 4) Iragarki-jartzaileek, interesa izango dutelako eskaintzen dituzten produktu eta zerbitzuei dagozkien ontologiak eraikitzeko. Powerset-ek APIak sortzeko eta mashupak eta beste aplikazio batzuk garatzeko teknologiak modu irekian eskaintzeko asmoa du. Non dago orduan Powerset-en negozioa? Hor ez dago berrikuntzarik: publizitatea eta teknologiaren lizentziak izango dira diru-iturriak. 2007/11/18 - 21:40:32
Euskararako baliabideak ACLWikin
Association for Computational Linguistics (ACL) hizkuntza naturalaren prozesamenduaren inguruko arazoez arduratzen diren profesionalen nazioarteko elkarte zientifikoa da. Elkarte horrek badu wiki bat ACLWiki deritzona. Bertan arlo horretako hainbat gai jorratzen dira: kongresuen, beken, lanpostuen, ikastaroen, etab.en berri ematen da. Badu atal bat Hizkuntza Naturalaren Prozesamenduko baliabideen berri ematen duena, hizkuntzaz hizkuntza antolatua. Orain arte atal horretan ez zegoen euskararako baliabideen informaziorik, baina azaroaren 15ean Iņaki Alegria adiskideak hornitu du Resources for Basque atala hainbat informazio interesgarriz. Eskerrik asko Iņaki! 2007/11/16 - 12:17:48
Euskaltzaindiko sarrera-ekitaldia
Urriaren 26an Euskaltzaindiko sarrera-hitzaldia egin nuen. Blog honetan hainbatetan erabiltzen ditudan gaien ingurukoa izan zenez, egokia iruditu zait hemen ere ekitaldi hura aipatzea. Hitzaldiaren testua jaits daiteke eta egun batzuetan behintzat baita ekitaldiaren bideoa ikusi ere 2007/10/29 - 11:53:39
Wolverhamptongo esperientzia ikaskuntza mugikorraren arloan
Ingalaterrako erdialdean dagoen 240.000 biztanle inguruko hiria da Wolverhampton. Hiri horretan proiektu bat jarri zuten abian Learning2Go izenekoa, eskolaumeei, eskuko ordenagailuak erabiliz, noiznahi eta nonahi ikasteko aukera ematen diena. Tresna horien bitartez, multimedia edukiak, Internet eta aplikazioak eskura dituzte nahi dutenean, nahi duten lekuan eta nahi duten moduan ikasteko. Learning2Go proiektuan irakasleek, ikasleek eta familiek parte hartzen dute. Hardware- eta software-fabrikatzaile batzuk, herri-erakunde batzuk eta ikertzaile batzuk ere partaide dira. Ikasleak du bere eskuko ordenagailuaren ardura. Egunean hogeita lau orduz, aste eta jai, eskueran du. Proiektuaren ardura, berriz, irakasleena da. Ikastetxe guztiek eskola-esparru osoan kablerik gabeko sarea hedatua dute. Ikasleak erabakitzen du zer tresna erabili, zer material bildu ikasteko, aukera du beste batzuekin lankidetzan jarduteko, material propioak sortzeko, etxekoei teknologiaren erabileran laguntzeko, etab. Proiektuak ez du tresna-mota bat aukeratu, edozein tresna onartzen du, zenbait baldintza betez gero: noiznahi eskura izateko bezain txikia izan behar du, berehala abian jartzeko modukoa izan behar du, kablerik gabeko konektibitatea izan behar du, eskoletan dauden tresna eta programekin interaktiboki lan egiteko gai izan behar du, arrazoizko prezioa izan behar du, argazki-kamera integratua, bereizmen handiko pantaila eta ikastetxeko eguneko jardunaldia irauten duen bateria izan behar ditu, aski sendoa izan behar du, memoria-txartel estandarrak irakurtzeko gai izan behar du, edukiak sartzeko eta lantzeko tresnak izan behar ditu, Interneten nabigatzeko eta multimedia eta flash edukiak erabiltzeko gai izan behar du. Orain arte edukirik erabiliena liburu elektronikoak, e-bookak, izan dira. Hauek liburuen eduki osoa duten bertsio elektronikoak dira, gainera bertan oharrak idazteko eta hiztegi bat kontsultatzeko aukera dutenak. Ikasleek beren liburu elektroniko propioak, besteen itxura berbera dutenak, egiteko ere badute aukera. Microsoft Reader formatukoak dira liburu horiek. Gaur egun formatu horretan jarritako liburu asko eskura daitezke Interneten (ingelesez, noski), batez ere klasikoak, baina baita liburu berriak ere, argitaletxe batzuk ari direlako liburu elektronikoak ateratzen. Ikus, esate baterako, ebooks.com-en katalogoa . Ikasleak, bere liburuak egiteko, Microsoft Word erabil dezake eranskin bat gehituta. 2007/10/05 - 11:42:26
SciVee: ikerketa zientifikoaren YouTube
SciVee izeneko web gunea AEBetako National Science Foundation-ek, San Diego Supercomputer Center-ek eta Public Library of Science-k jarri dute abian, zientzi ikertzaileek beren lanei buruzko txostenak eta bideoak parteka ditzaten. Bideo eta multimedia aurkezpen horien bidez, ikertzaileek beren lanen berri modu dibulgatiboan eman ahal izango dute. Guneak aukera ematen die zientzialariei aurkezpenak doan igotzeko, direla podcastak, bideoak, idazkiak, PowerPointez egindako aurkezpenak, flash fitxategiak, etab. Bisitariek, material horiek ikusteaz aparte, eztabaidak izan ditzakete egileekin edo beste erabiltzaile batzuekin eta gai jakinetako kanaletan harpidetzak egin ditzakete edo ekarpenak egin. Artikulu eta gakohitz jakinen inguruko erkidegoak sortzea ere posible izango da. Gunean bideoak ekoizteko argibide teknikoak ematen dira. Gomendatzen dute 10 minutu baino gehiagoko luzera ez dezatela izan. Creative Commons lizentzia aplikatzen zaie gunera igotzen diren bideo guztiei. 2007/09/24 - 13:05:25
