20/04/2015

Detalles de la nueva release de SaltOS (r7680)

MariaDB, Google, Tesseract, New release

Josep Sanz, Jordi Company, Andres Díaz

Esta nueva release aparece después de casi 2 años de trabajo y como siempre, también aporta nuevas funcionalidades como las que se describen a continuación:

Corrección de fallos:

Como siempre, una nueva release, debe corregir los fallos detectados, tanto por los desarrolladores como por parte de los usuarios.

Actualización de las librerías de terceros:

También se han actualizado a las últimas versiones todas las librerías de terceros para tener el código lo más actual posible y sobretodo, libre de fallos de seguridad, en la medida de lo posible.

Procesado de texto mediante el motor de OCR Tesseract:

Esta prestación permite a SaltOS obtener textos de las imágenes e indexarlo en la base de datos para mejorar la calidad de las búsquedas. Para ello, SaltOS usa el proyecto Tesseract (https://code.google.com/p/tesseract-ocr/ y http://es.wikipedia.org/wiki/Tesseract_OCR) el cual fue liberado como código abierto en el año 2005 por Hewlett Packard y la Universidad de Nevada, Las Vegas. Tesseract es desarrollado actualmente por Google y distribuido bajo la licencia Apache, versión 2.0.

SaltOS, además, aplica correcciones sobre los resultados para poder obtener textos de las páginas y así, poder procesar facturas, albaranes y demás documentos que se pueden procesar como listados de productos, detalles de facturas o albaranes o todo lo que los integradores de SaltOS necesiten.

Se ha mejorado el buscador de SaltOS:

El nuevo buscador de SaltOS ahora incorpora dos tipos de busquedas: en todo SaltOS o en todos los ficheros. Esto permite buscar lo que se desee en todos los registros de toda la base de datos o en todos los contenidos de todos los ficheros que haya procesado SaltOS.

Para ello, SaltOS se apoya en un motor llamado Mroonga (Fast Fulltext Search Engine). Este motor de búsqueda, permite a SaltOS conseguir unos tiempos de respuesta del orden de 100ms, en lugar de los anteriores n segundos que podía tardar en retornar resultados. Para poder usar esta prestación, bastará con usar MariaDB a partir de su versión 10.0.15 (https://mariadb.com/kb/en/mariadb/about-mroonga/), o usar la imagen de CentOS que distribuimos con todo el sistema pre-instalado y pre-configurado (http://download.saltos.org).

Actualización a la API v3 de Google:

Como ya se comentó en un post anterior, a principios de enero, la sincronización de la agenda de SaltOS con Google Calendar dejo de funcionar tras el cierre del servició mediante las APIs antiguas, con lo que se tuvo que hacer el I+D necesario para poder actualizar el código de acceso a Google Calendar y así, poder volver a tener en funcionamiento esta prestación tan usada de SaltOS. Una de las cosas que se tuvo que hacer también es investigar como conseguir el token de autentificación sin tener que poner el usuario ni clave de forma manual en el login de Google, aunque quien quiera más detalles de esta historia, que mire el post Acceso (login) transparente mediante la API v3 de Google

Nueva documentación de SaltOS

Tras varios intentos de hacer una documentación de usuario para SaltOS, Jordi Company, se ha puesto manos a la obra y ha hecho el gran paso de dotar a todas la aplicaciones de SaltOS de su correspondiente User Manual. El proceso de escritura se ha hecho usando el formato T2T, que mediante txt2tags (http://txt2tags.org/) permite obtener código LaTeX y HTML, ideales para generar los ficheros DPFs y para integrarlo en nuestra web. Para más info:


Líneas de XML
63,516
Líneas de PHP
15,136
Líneas de JS
14,449
Líneas de T2T
3,499
Líneas de XSLT
2,640
Líneas de SQL
1,685