Noticias

Dropbox incorpora búsqueda de texto en documentos PDF e imágenes

Por segunda vez en apenas dos meses, Dropbox ha mejorado su sistema de búsqueda de tal forma que ahora es capaz de buscar texto dentro de documentos PDF e incluso en archivos de imágenes como PNG o JPG.

Dropbox: busca lo que quieras dónde quieras

Parece ser que esta es la premisa de Dropbox, la popular plataforma de almacenamiento en la nube que durante los últimos meses se ha centrado en mejorar su sistema de búsqueda. El mes pasado la compañía implementó un nuevo motor de búsqueda basado en el aprendizaje automático y ahora anuncia estar mejorando la capacidad de reconocimiento óptico de caracteres (OCR) que permitan al usuario buscar texto tanto en archivos PDF como en imágenes.

«Los formatos de imagen (como JPEG, PNG o GIF) generalmente no son indexables porque no tienen ningún contenido de texto, mientras que los formatos de documentos basados ​​en texto (como TXT, DOCX, o HTML) generalmente son indexables. Los archivos PDF quedan en medio ya que pueden contener una mezcla de texto y contenido de la imagen. El reconocimiento de texto automático de la imagen es capaz de distinguir de forma inteligente entre todos estos documentos para categorizar los datos que contiene.

A pesar de la buena noticia, por el momento esta nueva mejora se encuentra limitada en dos aspectos. Por un lado, parece estar limitada al idioma inglés:

Así que ahora, cuando un usuario realiza una búsqueda de texto en inglés que aparece en uno de estos archivos, se mostrará en los resultados de búsqueda.

Por otro lado, tal y como recoge Jon Porter en The Verge, la función está limitada a los niveles de suscripción más caros.

La nueva característica […] está disponible ahora para los usuarios Dropbox Business Advanced y Enterprise, y debe estar disponible para los suscriptores de Dropbox profesionales en los próximos meses.

El funcionamiento es similar a la tecnología ya implementada en la aplicación móvil de Dropbox el año pasado: utilizar la app para fotografiar un documento, pero ejecutando OCR al mismo tiempo para extraer el texto. Sin embargo, esto solo funcionaba con un pequeño subconjunto de los documentos.

[irp]

Al implementar las capacidades OCR directamente en el motor de búsqueda, ahora Dropbox es capaz de buscar texto dentro de todos sus archivos PDF e imágenes, sin importar la forma en que fueron escaneados o fotografiados.

Recent Posts

  • Procesadores

Intel Core Ultra 9 vs Ultra 7 vs Ultra 5 ¿Cuál debo elegir?

Hoy comparamos el Intel Core Ultra 9 vs Ultra 7 vs Ultra 5, los tres…

6 horas atrás
  • Audio y multimedia

Tronsmart Mirtune H1 Review en Español (Análisis completo)

En esta ocasión, hemos podido probar el nuevo altavoz Tronsmart Mirtune H1 de 8W, que…

7 horas atrás
  • Procesadores

Intel EVO Edition ¿Qué novedades nos presenta?

Intel EVO Edition es el nombre de la plataforma diseñada para portátiles equipada con las…

8 horas atrás