La recherche dans les contenus intégrés à Aklabox est basée sur le composant open source Solr/Lucene de la fondation Apache.

Apache Solr est un puissant moteur d’indexation et de recherche en texte intégral possédant les fonctionnalités standard suivantes :surlignage des termes trouvés, recherche à facettes, auto-suggestion, auto-complétion, recherche géospatiale, regroupement de résultats selon la valeur d’un champ, synonymie, indexation native de documents bureautiques (Adobe PDF, Microsoft Word, etc).

Solr est optimisé pour une utilisation intensive et les volumes de données importants.

Son architecture est flexible et évolutive : il est possible d’ajouter des nœuds serveurs à l’infrastructure pour distribuer la charge de recherche et d’indexation sur plusieurs machines.

Nos clients peuvent ainsi peuvent ainsi démarrer en utilisant un service intégré sur le serveur applicatif Aklabox pour ensuite le faire évoluer en fonction de la volumétrie et de la charge en un véritable cluster de recherche privé composé de plusieurs serveurs.

Cette architecture distribuée permet de répartir la charge mais aussi de construire un cluster avec tolérance de panne.

aklabox_search_image1
Le composant Aklabox / Search peut faire l’objet d’un déploiement, autonome afin de servir de moteur de recherche pour votre intranet ou pour votre CMS comme par exemple Drupal.

Pour l’un de nos clients, nous avons développé un module Drupal d’administration d’une instance Solr Cloud utilisée comme moteur de recherche pour les contenus du site Drupal ainsi que pour les contenus d’autres sites secondaires, comme notamment ses chaînes Youtube et Flickr.

Cette intégration permet, grâce à l’utilisation d’Apache Nutch comme robot de collecte, d’indexer des contenus externes pour faire de leur CMS un véritable portail d’accès à tous leurs contenus, quel que soit le site sur lequel ils sont publiés.

aklabox_search_integration2