Blog de la Biblioteca de Matemàtiques i Informàtica


Deixa un comentari

The Pirate Bay tanca definitivament el seu tracker

The Pirate Bay, un dels indexadors de fitxers BitTorrent més usat arreu del món i que es va veure immers en un sonat procés judicial l’any passat ha anunciat que tancarà definitivament el seu tracker i anima la resta a seguir el mateix camí. Però malgrat el que pugui semblar no estem parlant d’una victòria de la indústria de continguts que criminalitza les descàrregues sinó d’un triomf de la tecnologia que, com sempre, va deu passes per endavant.

Tot i que ja era possible compartir fitxers sense tracker a través de BitTorrent, era una opció que encara no s’havia popularitzat i molts clients no la implementaven. A la pràctica, calia una màquina que coordinés la distribució entre ordinadors connectats, que centralitzés la informació sobre quins clients compartien determinar fitxer. Però amb l’avenç tecnològic que suposen especialment PEX (Peer Exchange) i DHT (Distributed Hash Table), s’aconsegueix una distribució descentralitzada sense necessitat d’un ordinador que coordini les descàrregues i asseguri el funcionament de la xarxa. En aquest cas són els mateixos ordinadors connectats els qui s’encarreguen de mantenir i distribuir la informació relativa a les descàrregues.

Per descomptat la descentralització és un avantatge tècnic important perquè fa que la xarxa no depengui d’una sola màquina i, a la vegada, dificulta molt més el control sobre què es descarrega i qui ho descarrega.

Font: Slashdot


Deixa un comentari

Google i reCAPTCHA: on no arriba l’OCR arriba l’usuari

reCAPTCHAGoogle ha tornat a sorprendre mig món amb un moviment tan inesperat com hàbil. El 16 de setembre anunciaven oficialment la compra de reCAPTCHA, un servei de CAPTCHA molt popular, amb la característica afegida que ajuda a digitalitzar llibres i diaris antics.

Un CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart) és un sistema d’autenticació que intenta determinar si l’usuari que vol accedir-hi és un ésser humà o una màquina, mostrant paraules o seqüències de caràcters una mica distorsionades que l’usuari ha de reproduir en una caixa de text. L’objectiu és evitar que els robots es puguin registrar a determinats serveis -per exemple, obrir un compte de correu electrònic per enviar correu brossa- o participar a enquestes.

Quan es digitalitza un text imprès s’obté una imatge. Per convertir aquella imatge a text i poder-hi fer cerques, exportar-lo, editar-lo o escalar-lo, cal passar un programa de reconeixement òptic de caràcters (OCR). Depenent de diversos factors -qualitat de l’original, suport, tipografia- el reconeixement és més o menys precís i els errors habituals, la qual cosa fa el procés lent i costós.

Text digitalitzat i text reconegut després de passar l'OCR

Text digitalitzat i text reconegut després de passar l'OCR

La particularitat de reCAPTCHA és que mostra dues paraules. La primera no té cap característica especial, però la segona ha estat digitalitzada prèviament d’un llibre o diari antic i l’OCR no l’ha reconegut. Si l’usuari reprodueix correctament la primera imatge, el sistema assumeix que també ho ha fet correctament amb la segona, de manera que la feina que l’OCR no ha estat capaç de fer, l’ha fet l’usuari gratuïtament. Segons reCAPTCHA es resolen al dia uns 200 milions de CAPTCHA arreu del món. Amb la col·laboració sovint inconscient de milions d’usuaris s’hauria pogut arribar a un nivell d’exactitud superior al 99,5%.

Tenint en compte que un dels projectes estrella de Google és justament Google Books, entenem de seguida l’interès per adquirir la companyia. L’endemà d’anunciar la compra de reCAPTCHA anunciaven un acord amb On Demand Books que permetrà imprimir a demanda qualsevol dels dos milions de llibres de domini públic prèviament digitalitzats, des de qualsevol llibreria o institució que hagi adquirit la Espresso Book Machine.

PS. El Turing a què fa referència l’acrònim CAPTCHA és Alan Turing, de qui ja hem parlat abans, i concretament al Test de Turing però a la inversa.

Font: Vida digital


Deixa un comentari

Dataliberation, o com recuperar les dades dels serveis de Google

Data Liberation FrontCada vegada és més freqüent el debat entre defensors i detractors de Google a causa d’una política expansiva que sembla imparable. Molts usuaris patim la contradicció entre gaudir d’unes aplicacions innovadores, que ens han facilitat enormement la vida i la sensació que cada vegada depenem més del gegant intangible, el ciberleviatan que creix dia a dia i que ha deixat de ser un motor de cerca per abastar-ho gairebé tot. El creixement de Google recorda altres intents monopolístics anteriors i els usuaris som reticents a la dependència però, sobretot, a la incertesa pel que fa al control de les nostres dades.

Si fem servir Gmail, Google Docs i Google Reader, per exemple, no només oferim un llaminer perfil de qui som i quins interessos tenim, sinó que a més allotgem el correu i els nostres documents als servidors de l’empresa nord-americana, amb la qual cosa en perdem el control. Malgrat la inquietud que pot provocar aquesta situació i les posicions absolutament contràries de gent més que documentada, és l’usuari qui ha de valorar els beneficis i els riscos i optar pel que més li convingui. Arribats a aquest punt i suposant que decidim abandonar algun dels serveis que utilitzàvem, es planteja la qüestió de la importació/exportació de dades, la migració d’un servei a un altre de la competència, els formats oberts i els estàndards.

En aquest sentit Google torna a anar unes quantes passes davant de la majoria i un equip d’enginyers de la companyia han creat el “Front d’Alliberament de Dades” amb l’objectiu de garantir que els usuaris puguin exportar les dades que ells mateixos han generat, de manera senzilla, sense costos afegits i usant formats oberts. Al web hi ha, ordenades per productes, les explicacions detallades per guiar-nos durant el procés d’exportació. Encara no hi són tots, però segons el propi equip dues terceres parts de la feina està feta i continuaran en la mateixa línia.

El plantejament de Google és fidelitzar l’usuari a través de la innovació i la qualitat dels seus productes, que s’hi quedi perquè realment ho vol enlloc d’atrapar-lo perquè no pugui marxar. Facilitar-nos la sortida és sens dubte una bona política que haurien de prendre com a exemple moltes altres companyies, però en el nostre cas fa que la contradicció a què al·ludíem al principi encara s’agreugi.

Font: El blog de Enrique Dans | Error500


Deixa un comentari

El tricicle de Google Street View arriba més enllà que el cotxe

Google Trike

Ja fa mesos que els cotxes de Google Street View circulen per les ciutats d’arreu del món fotografiant els carrers per donar suport a Google Maps. Per superar els obstacles físics i poder captar imatges també d’aquells emplaçaments per on no pot circular un cotxe, Google ha posat a circular el Google Trike, que recorrerà zones peatonals i turístiques fent fotografies per completar els mapes a peu de carrer.

Podeu veure un exemple del funcionament de Google Maps a partir d’aquesta fotografia de l’edifici històric de la UB.

Més informació: Google Street Views Takes to a Tricycle (PC World)

Font: google.dirson.com


Deixa un comentari

La UOC presenta la traducció al català de l’Informe Horizon 2009

Informe Horizon 2009La Universitat Oberta de Catalunya (UOC) i el New Media Consortium (NMC) han presentat conjuntament i per tercer any consecutiu, l’Informe Horizon traduït al català i al castellà.

L’Informe Horizon analitza cada any l’impacte de les noves tecnologies a l’ensenyament superior, i enguany se centra sobretot en la tecnologia mòbil, la computació en núvol, la geocodificació, el web personal, les aplicacions amb consciència semàntica i els objectes intel·ligents.

L’informe és el resultat de l’anàlisi i les propostes d’un consell assessor format per una trentena d’experts que treballen col·laborativament a través d’un wiki on es pot seguir el procés de redacció i discussió.


Deixa un comentari

Bohemian Rhapsody, versionada per ordinadors antics


bd594, un usuari de YouTube ha tingut la paciència de reproduir, mitjançant ordinadors i altres components informàtics antics, l’emblemàtica cançó de Queen, Bohemian Rhapsody. Els membres d’aquesta insòlita banda són:

  • Un Atari 800XL com a piano/òrgan solista
  • Un Texas Instruments TI-99/4a com a guitarra solista
  • Una disquetera de 8 polzades com a baix
  • Un disc dur de 3,5 polzades com a gong
  • Un escàner HP ScanJet 3C per a totes les veus. Sobre això bd594 aclareix que va haver d’enregistrar per separat les quatre veus atès el preu exagerat que demanaven els venedors a ebay per cada escàner.

L’autor reconeix que algun membre de la banda de vegades desafina, però recorda també que els escàners i les disqueteres no són instruments musicals. El resultat és com a mínim curiós, però us deixem també l’original, ja sigui per comparar-los o com a exercici de sana nostàlgia.

Font: Menéame


Deixa un comentari

PandaLabs detecta motors de cerca dissenyats per distribuir malware

Malware

PandaLabs, el centre de detecció de virus i de suport tècnic de Panda Security ha constatat una nova tendència a l’hora de distribuir malware, consistent en la creació de motors de cerca específicament dissenyats per oferir com a resultats enllaços a pàgines que contenen programes maliciosos.

Fins ara, els qui es dediquen a escampar virus i programes maliciosos havien buscat la manera de posicionar les seves pàgines en els primers resultats dels motors de cerca més habituals. Però amb aquest salt qualitatiu comencen a dissenyar els seu propis motors per conduir els usuaris incauts a les pàgines que contenen aquest programes i que s’amaguen sovint darrera de suposades actualitzacions de visualitzadors de videos o connectors diversos.

El consell de Luis Corrons, director de PandaLabs és usar només motors de confiaça i extremar les precaucions als webs on s’ofereixen vídeos sensacionalistes: “si en un d’aquests webs se’ns demana que descarreguem un codec o un determinat programa per poder veure un vídeo, hi ha moltes possibilitats que es tracti de codi maliciós.”

Des d’aquí afegiríem que navegant amb sentit comú, protegint-se i anant amb compte cada vegada que un web intenti instal·lar res a l’ordinador n’hi hauria d’haver prou. O millor encara: usant Linux aquest és un problema que segurament no tindríem.

Font: PandaLabs: centro de prensa


Deixa un comentari

Proposen un atac DDo$ com a resposta a la multa a The Pirate Bay

The Pirate BayGottfrid Svartholm, un dels fundadors de The Pirate Bay, que juntament amb Peter Sunde, Fredrik Neij i Carl Lundstrom, va ser condemnat a pagar 30 milions de corones sueques (una mica més de 2.800.000 euros) en un judici més que discutit, ha ideat una resposta enginyosa en forma d’atac distribuït de denegació de servei (DDoS). Però al món real, amb diners enlloc de bytes.

Svartholm afirma que de cap manera es pagarà la multa, però proposa als internautes que facin efectiu un pagament d’una corona sueca (una mica més de 9 cèntims) al bufet Danovsky & Partners. Així com un atac DDoS provocaria la saturació d’un servidor a causa de milers de peticions simultànies, aquest DDo$ -com l’ha batejat Svartholm-, tindria el mateix efecte però sobre la gestió administrativa del bufet i sobre les seves finances.

Atac DDos

Atac DDoS. Imatge extreta de Securityfocus

Segons un confident anònim, el compte bancari que utilitza el bufet per rebre els pagaments, cobra una comissió de 2 corones sueques a partir de les 1.000 primeres transaccions. Superada aquesta xifra, per cada corona sueca ingressada n’hauria de pagar dues. Els efectes immediats són clarament deduïbles: saturació administrativa del bufet i uns costos de gestió que duplicarien els ingressos. A més, apunta Svartholm, si després de fer el pagament hom determina que és erroni, la legislació sueca obliga el receptor a retornar els diners, amb l’afegit que això suposa per a Danovsky & Partners.

No sabem com acabarà aquest cas però és evident que a la gent de The Pirate Bay només els calen reptes per aguditzar l’enginy.

Font: Menéame


Deixa un comentari

Durant el mes de maig es presentarà Wolfram|Alpha

Wolfram|Alpha

Stephen Wolfram, creador del programa Mathematica i autor de A new kind of science, va anunciar el 5 de març a través del seu bloc que el mes de maig començarà a funcionar Wolfram|Alpha, un cercador de coneixement computacional, que treballarà processant el llenguatge natural.

A diferència dels motors de cerca habituals, Wolfram|Alpha no es limitaria a trobar resultats a partir de certes paraules introduïdes en una caixa de text sinó que basaria el seu funcionament en l’anàlisi i el càlcul: l’usuari formularia preguntes concretes en llenguatge natural -com les faria a una altra persona-, i el cercador retornaria la resposta, calculada a partir de la base de dades i determinats algorismes.

El projecte és molt ambiciós i cal veure si les bones intencions es concreten més enllà de la publicitat, però sembla que la manera de funcionar de Wolfram|Alpha no amenaçaria l’hegemonia dels motors de cerca consolidats perquè es tracta més d’un servei de pregunta-resposta que no d’un motor a l’ús: no ofereix enllaços a infinitat de documents que contenen determinades paraules sinó que pretén satisfer una pregunta concreta amb una resposta inequívoca.

El 28 d’abril es va presentar en primícia a la Facultat de Dret de Harvard. El vídeo de la presentació ja és a YouTube:

Font: Genbeta | Alt1040