Nepomuk/ca: Difference between revisions

From KDE UserBase Wiki
(Created page with "Nepomuk")
 
No edit summary
 
(204 intermediate revisions by 2 users not shown)
Line 1: Line 1:
<languages />  
<languages />  


=Nepomuk=
=Cerca semàntica=


The aim of this page is not to fully explain the Nepomuk technology and every detail, but to give a short overview, some examples, share the vision behind it and link to relevant information on the web.
L'objectiu d'aquesta pàgina no és explicar plenament la tecnologia de la cerca semàntica del KDE i cada detall, però ens donarà una breu visió general, alguns exemples, comparteix el que hi ha al darrere i enllaça a informació pertinent al web.


==Short explanation==
== Baloo és la següent generació de la cerca semàntica ==


As the [[Special:myLanguage/Glossary#Nepomuk|Glossary]] mentions, Nepomuk is about classification, organisation and presentation of data. It is not an application, but a component which can be used by developers within applications.
A partir de les aplicacions del KDE 4.13, el marc de treball per a la indexació i cerca de fitxers del '[https://community.kde.org/Baloo Baloo]' substitueix al Nepomuk. Llegiu els [http://dot.kde.org/2014/02/24/kdes-next-generation-semantic-search detalls sobre els canvis per a les aplicacions 4.13]. La cerca semàntica ja no utilitza una sola gran base de dades, sinó bases de dades independents i especialitzades per a cada tipus de dades. Les bases de dades de la nova cerca es troben a <tt>$HOME/.local/share/baloo</tt>. Si heu actualitzat a les aplicacions KDE 4.13 des d'una versió anterior del KDE, podeu eliminar <tt>$KDEHOME/share/apps/nepomuk</tt>.


=== Try out ===
==Una breu explicació==
For example, [[Special:myLanguage/Dolphin|Dolphin]] makes use of Nepomuk. For the following to hold Nepomuk and Strigi must be enabled from System settings -> Desktop search. The information sidebar of Dolphin allows you to assign tags, ratings and comments to files. This information is then stored in Nepomuk and indexed by Strigi. You can then search for metadata using the navigation bar in Dolphin. Write "nepomuksearch:/" followed by search terms.


==Functionalities==
Tal com esmenta el [[Special:myLanguage/Glossary#Nepomuk|Glossari]], la cerca semàntica tracta la classificació, organització i presentació de les dades. No és una aplicació, sinó un component que poden utilitzar els desenvolupadors dins de les aplicacions.


Nepomuk offers several 'layers' of functionality to applications. The first and most simple of those is manual tagging, rating and commenting, as used in Dolphin. This helps you to find your files faster, but is also a lot of work.
=== Proveu en el Dolphin ===
Per exemple, el gestor de fitxers [[Special:myLanguage/Dolphin|Dolphin]] fa ús de la cerca. En les aplicacions del KDE, la cerca semàntica de versions anteriors a la 4.13 han d'estar activada a <menuchoice>Arranjament del sistema -> Cerca a l'escriptori</menuchoice>. La barra d'informació de Dolphin (<menuchoice>Control -> Plafons -> Informació</menuchoice>, o premeu <keycap>F11</keycap>) presenta informació extreta per la cerca sobre el fitxer seleccionat, i us permetrà assignar etiquetes, valoracions i comentaris als fitxers. Aquesta informació és emmagatzemada i catalogada per la cerca. A continuació, podeu cercar metadades utilitzant la barra de navegació de Dolphin. Feu clic a <menuchoice>Cerca</menuchoice> o premeu <keycap>Ctrl + F</keycap> i cerqueu per noms de fitxer o contingut del fitxer.


To make finding files containing text easier, Nepomuk offers a second functionality: indexing the text of files. It uses a technology called [[Special:myLanguage/Glossary#Strigi|Strigi]] for this. You can now also find files by entering some words which you know are in there, or just (part of) their title.
<!-- info about nepomuksearch:/ deleted per its developer: "Actually nepomuksearch:/ is an internal thing and should not be entered by the user." its developer -->


The third layer is a very complex one, and the reason why Nepomuk was conceived as a research project of several companies and universities in the European union. This is where you will find difficult words like 'semantic desktop' and 'ontologies'. Basically, it is about context and relationships.


==Examples==
==Funcionalitats==


Let me try to explain what Nepomuk offers using two examples.
La cerca semàntica del KDE ofereix diverses «capes» de funcionalitat per a les aplicacions. La primera i més simple d'elles és l'etiquetatge manual, valoracions i comentaris, com s'usen en Dolphin. Això us ajudarà a trobar els fitxers més ràpidament, però també suposa molt treball.


===Relationship===
Per a facilitar la cerca de fitxers que continguin un cert text, la cerca ofereix una segona funcionalitat: indexar el text dels fitxers. Podeu cercar fitxers introduint algunes paraules que sabeu que hi són, o simplement el seu títol (o una part d'aquest).


Say you received a photo from a friend of yours, 2 weeks ago. You saved it somewhere on your computer. Now how to you find that file? If you don't remember the location, you're out of luck.
La tercera capa és molt més complexa, i el motiu és que la tecnologia subjacent, Nepomuk, ha estat concebuda com un projecte d'investigació de diverses companyies i universitats de la Unió Europea. Aquí trobareu paraules difícils com «escriptori semàntic» i «ontologies». Bàsicament, es tracta de contextos i relacions.


Now Nepomuk aims to help you. You know this file came from that friend of yours, your computer does not. Nepomuk, however, can remember this relationship. Searching on the name of your friend will therefor pop up the photo!
=== Indexació de fitxers ===


Another potential relationship is between a web page you copied text from and the document you pasted it into, or two images showing the same car. Such relations can sometimes be extracted from the files themselves (you could analyze photos and see who or what is on there) or supplied by the applications involved (as in the above email example). This part of Nepomuk is still under heavy development, and needs integration in applications, so you can expect it to take a few more years to really shine.
La cerca no indexa tots els fitxers que hi ha al disc dur. La seva configuració per omissió en la majoria de les distribucions de Linux exclou alguns patrons comuns per als fitxers de còpia de seguretat i directoris de configuració. Ho podeu canviar a <menuchoice>Arranjament del sistema -> Cerca a l'escriptori</menuchoice>. Afegiu les carpetes a excloure. Si voleu desactivar completament la indexació dels fitxers, només hi heu d'afegir la vostra carpeta d'inici.


All in all, this part of Nepomuk is about making search smart. Think about how Google tries to be smart with your searches: when you search for a hotel and a city name, it shows above the website results a google map showing hotels in the city you mentioned! It might even suggest a better name in case you made a spelling mistake. Google also tries to put the most relevant information on top of the list of results, using complex calculations on relationships (links) between websites. Nepomuk will be able to offer such smart results and order them on relevancy using relationship information.
En '''Arranjament del sistema''' també podeu controlar si la cerca indexarà els fitxers als suports extraïbles com ara unitats USB i CD-ROM. A les aplicacions del KDE 4.13 això no està disponible, els suports extraïbles no s'indexen. En futures versions s'està planificant el reintroduir aquesta funcionalitat.


===Context===
==Exemples==


These relationships can not only help you while searching for files, but also have an influence on applications and what information they present. Note that this way of using Nepomuk is still more a vision than reality! Many of the components are in place, but it is not yet integrated in applications and the desktop as a whole.
Permetin-me mirar d'explicar què ofereix la cerca semàntica usant dos exemples. Aquestes característiques encara no estan completament disponibles -la base hi és, però els desenvolupadors d'aplicacions necessiten integrar-la a les seves aplicacions-.


So here an example of bringing context awareness to your desktop could help you work more efficiently.
===Relacions===


Say you are working on finishing some notes you took in a meeting. The phone rings, and somebody asks you to find that spreadsheet with prices, adjust it for a customer. After a few more interruptions you find your desktop full of files and windows...
Diguem que heu rebut una fotografia d'un amic, fa dues setmanes, i l'heu desada en algun lloc al vostre ordinador. Com trobareu ara aquest fitxer? Tret que sapigueu la ubicació, no té bona pinta.


It'd be nice to be able to organize all that a bit better, right?
La cerca semàntica té com a objectiu ajudar-vos. Sabeu que aquest fitxer us el va enviar aquest amic, però el vostre ordinador no. La cerca, no obstant, pot recordar aquesta relació. De manera que en cercar el nom de l'amic aparegui la fotografia!


Enter '[[Special:myLanguage/Glossary#Activities|activities]]'. These have been introduced in [[Special:myLanguage/Plasma|Plasma]], and currently offer different 'desktops'. They are a bit like virtual desktops, except that the desktop itself changes, not the set of applications. Different widgets, background, things like that. Of course, since KDE 4.3, each virtual desktop can have it's own activity, bringing the two in sync.
Una altra possible relació és entre una pàgina web de la qual heu copiat text i el document en el qual l'heu enganxat, o dues imatges mostrant el mateix cotxe. Aquestes relacions de vegades poden ser extretes dels propis fitxers (podeu analitzar fotografies i veure qui o què hi apareix) o proporcionades per les aplicacions involucrades (com en l'anterior exemple sobre correu electrònic). Aquesta part de la cerca està encara sota un fort desenvolupament, i necessita integració amb les aplicacions, per la qual cosa pot trigar uns quants anys fins que de debò brilli.


If applications and desktop were aware of activities, you could create an activity for each of the tasks you regularly work on. So if you often have to change a spreadsheet with prices, you create an activity for that: put a Folder View (or several) widget on the desktop, add a calculator and a todo-widget to keep track of what you still have to change. Maybe even an email folder widget showing the mails with questions regarding these prices spreadsheets!
En conjunt, aquesta part de la cerca semàntica tracta de fer cerques intel·ligents. Pensa sobre com Google intenta ser intel·ligent amb les teves cerques: quan cerqueu un hotel i el nom d'una ciutat, mostra sobre els resultats d'un lloc web un mapa que mostra hotels a la ciutat esmentada. Fins i tot pot suggerir-vos un nom millor en el cas que hageu comès un error ortogràfic. Google també mira de posar la informació més apropiada al començament de la llista de resultats, utilitzant complexos càlculs sobre relacions (enllaços) entre pàgines web. La cerca semàntica serà capaç d'oferir aquest tipus de resultats intel·ligents i ordenar-los segons la seva adequació utilitzant la informació sobre relacions.


As soon as somebody asks a question about prices, you switch to this activity. Fire up your spreadsheet application. It is aware of your activity so it shows recent price spreadsheets, not the recent list of inventory you were working on in another activity! [[Special:myLanguage/Kopete|Kopete]], the chat application shows your colleague who knows all about prices, as she is the person you always chat with when working on this activity.
===Contextos===


When you are finished, you go back to another activity, and once again all applications adjust their behavior to fit what you are doing.
Aquestes relacions no solament poden ajudar-vos a cercar fitxers, sinó que també tenen influència en les aplicacions i en la informació que presenten. Tingueu en compte que aquesta forma d'usar la cerca és més una visió que una realitat! Molts dels components estan en el seu lloc, però no han estat integrats en les aplicacions ni en l'escriptori en el seu conjunt.


The benefits of such an activity-based work flow go further than you might at first expect. It not only helps you find files and contact persons, but also helps in switching tasks itself. The human brain isn't very good at multi-tasking - it takes most people several minutes to get up to speed after switching tasks. Changing the 'environment' helps a lot in speeding this up, even if it's just on the screen. Compare it with getting in the mood for your holiday by packing your bag!
Vet aquí un exemple de com el portar la informació contextual al vostre escriptori pot ajudar-vos a treballar de forma més eficient.


Of course, the above is mostly relevant to people working behind their computer in the office or at home. A gamer or a casual user would probably not use these activities much.
Diguem que esteu treballant per acabar algunes notes agafades en una reunió. Sona el telèfon i algú us demana si podeu cercar el full de càlcul amb preus i adaptar-lo a un client. Després d'algunes interrupcions més descobriu que el vostre escriptori està ple de fitxers i finestres...


Note that the scenario described above is still years away from reality. Much of the basic infrastructure for this in KDE is in place but much is still left.
Estaria bé poder-ho organitzar tot una mica millor, oi?


==Sharing and privacy==
Entren en joc les «[[Special:myLanguage/Glossary#Activities|activitats]]». Aquestes han estat introduïdes en [[Special:myLanguage/Plasma|Plasma]], i actualment ofereixen diferents «escriptoris». Són similars als escriptoris virtuals, però on el que canvia és l'escriptori en si, no les aplicacions. Conté diferents estris, fons de pantalla i coses així. Per descomptat, des de Plasma 4.3, cada escriptori virtual pot tenir la seva pròpia activitat, amb els dos en sincronia.


There is one thing I need to touch on before pointing to other sources of information: sharing Nepomuk data. It'd be great if your tags, ratings and comments would be shared with others when you send them files. However, if you tagged a contact with a slightly embarrassing tag ('boring in bed') and send that persons contact information to a mutual friend you probably don't want that tag to be send as well...
Si les aplicacions i l'escriptori estiguessin al tant de les activitats, podríeu crear una activitat per a cadascuna de les tasques en les quals treballeu regularment. Per tant, si normalment canvieu a un full de càlcul amb preus, podeu crear una activitat per a això: posant un estri de Vista de carpeta (o varis) en l'escriptori, afegint una calculadora i un estri de tasques pendents per a seguir la pista del que encara s'ha de canviar. Potser fins i tot un estri de carpetes de correu electrònic mostrant els correus amb preguntes relacionades amb aquest full de càlcul!


This issue is of course being considered and an important subject of research by the Nepomuk researchers. For the time being, these privacy concerns, combined with technical challenges, are the reason Nepomuk context is private. Rest assured the Nepomuk team does all it can to make sure your privacy is respected.
Tan aviat com algú faci una pregunta sobre preus, canvieu a aquesta activitat, i ja podeu treballar amb la vostra aplicació de fulls de càlcul. És conscient de la vostra activitat pel que us mostra fulls de càlcul de preus recents, no la recent llista de l'inventari en la qual esteu treballant en una altra activitat! [[Special:myLanguage/Kopete|Kopete]], l'aplicació de xat, ens mostra als companys que ho saben tot sobre els preus, ja que són les persones amb les quals parleu sempre que treballeu en aquesta activitat.


:''More info'':
Quan acabeu, torneu a l'altra activitat i una vegada més totes les aplicacions ajustaran el seu comportament al que estigueu fent.
::[http://en.wikipedia.org/wiki/Semantic_desktop Wikipedia - Semantic Desktop]
::[http://en.wikipedia.org/wiki/NEPOMUK_(framework)  Wikipedia - NEPOMUK Framework]
::[http://nepomuk.semanticdesktop.org/xwiki/bin/view/Main1/ NEPOMUK website]
::[http://nepomuk.kde.org/discover/user NEPOMUK KDE site]
::[http://dot.kde.org/2009/12/10/exploring-new-nepomuk-features-mandriva-linux-2010 article explaining Nepomuk on the DOT]


[[Category:System]]
Els beneficis d'aquesta forma de treball basada en activitats van més enllà del que pugueu esperar al principi. No solament us ajuda a trobar els vostres fitxers i contactes, també a commutar tasques per si mateix. El cervell humà no és molt bo amb tasques múltiples -a la majoria de la gent li porta uns minuts agafar velocitat després de canviar de tasca-. El canvi d'«entorn» ho agilitza, fins i tot si només esteu a la pantalla. Compareu-ho amb l'alegria de fer les maletes per anar-vos-en de vacances!
 
Per descomptat, l'anterior sobretot serà apropiat per a la gent que treballa amb el seu ordinador en una oficina o a casa. Un jugador o un usuari informal probablement no utilitzaran aquestes activitats.
 
L'escenari descrit anteriorment ja s'implementa parcialment en les activitats, però encara queda molta feina per fer.
 
==Preguntes més freqüents==
 
El següent s'ha agafat d'un missatge dels [http://forum.kde.org/viewtopic.php?f=154&t=97098&p=204592 fòrums del KDE]. Si us plau, sou lliure d'afegir/treure/modificar els detalls, si teniu temps!
 
;Què és l'escriptori semàntic del Nepomuk, i l'indexador de fitxers de l'escriptori Strigi?
 
:Nepomuk i Strigi formen part de les tecnologies del que ofereixen les capacitats de la cerca semàntica al KDE. Ambdós no són utilitzats directament en l'última generació de la cerca semàntica del KDE ([http://dot.kde.org/2014/02/24/kdes-next-generation-semantic-search detalls]), però, els seus successors comparteixen gran part del seu codi i conceptes. La cerca semàntica proporciona una forma d'organitzar, anotar i construir les relacions entre les dades (no només el nom de fitxer i el contingut, sinó per exemple les aplicacions que utilitzen un determinat fitxer, o com és etiquetat aquest fitxer). Una sèrie d'aplicacions i espais de treball del KDE utilitzen aquesta infraestructura bàsica per oferir característiques com ara l'etiquetatge del correu electrònic ([[Special:myLanguage/KMail|KMail]]) o l'activitat d'arranjament (Plasma).
 
:La indexació de fitxers permet a les aplicacions, com ara [[Special:myLanguage/Dolphin|Dolphin]] poder cercar fitxers basant-se en el contingut, el nom, o altres meta-dades (per exemple, etiquetes) associades als fitxers indexats. Com un indexador també pot indexar fitxers sense text, com fitxers PDF, accedint a les meta-dades contingudes en aquests fitxers (autor, informació sobre publicació, etc.) Alguns components del KDE aporten «analitzadors» addicionals per a més tipus de fitxer.
 
; Per què necessitem Akonadi i la cerca semàntica? No fan el mateix?
 
:En resum, Akonadi proporciona una memòria cau de les dades PIM, com els elements de calendari, contactes i correu electrònic, el qual és utilitzat per les aplicacions com el KMail i KOrganizer, així com pel calendari integrat al Plasma. La cerca semàntica es connecta amb Akonadi per a proporcionar la funcionalitat de cerca. El mètode en el que Baloo ofereix la cerca és en realitat determinat per l'aplicació. En el cas de la informació PIM del KDE, s'utilitza Xapian per a proporcionar la indexació i la cerca.
 
;Com puc deshabilitar l'escriptori semàntic?
 
:La indexació de fitxers es pot desactivar mitjançant l'addició de la carpeta d'inici de l'usuari per a la <menuchoice>Arranjament del sistema -> Cerca a l'escriptori -> No cerquis en aquestes ubicacions</menuchoice>. L'altra funcionalitat forma part de les aplicacions que l'utilitzen i per tant no es poden deshabilitar sense paralitzar aquestes aplicacions. Per exemple, per no tenir cap cerca al KMail haureu d'esborrar el KMail...
 
En les versions de les aplicacions KDE abans del 4.13, la cerca semàntica tenia components executant-se independentment de les aplicacions. Aquesta funcionalitat es pot deshabilitar desmarcant <menuchoice>Activa l'indexador de fitxers Nepomuk</menuchoice> a la secció de [[Special:myLanguage/System_Settings/Search_Desktop|Cerca a l'escriptori]] de [[Special:myLanguage/System Settings|Arranjament del sistema]]. Si voleu desactivar totes les característiques semàntiques, desmarqueu <menuchoice>Activa l'escriptori semàntic del Nepomuk</menuchoice>. Tingueu en compte que això també desactivarà la cerca al [[Special:myLanguage/Dolphin|Dolphin]].
 
:Tingueu en compte que amb l'última opció alguns programes que utilitzen la cerca semàntica per a les meta-dades oferiran una funcionalitat reduïda: Per exemple, el [[Special:myLanguage/KMail|KMail]] no serà capaç d'etiquetar el correu o les activitats de Plasma no oferiran característiques addicionals com les icones, o informació de dades als programes.
 
;Baloo/Cerca semàntica és mengen el 100% de la CPU! Què faig?
 
:Simplement espereu. Certs fitxers són molt difícils o fins i tot impossibles d'indexar. Ara mateix, això inclou, per exemple, fitxers de text de més de 50 megabytes .Quan la cerca els troba, ho intentarà durant un temps fix. Quan falla , intentarà esbrinar quin fitxer està forçat i desactivarà la seva indexació en el futur. Com els fitxers són indexats per lots d'uns 40, haurà de trobar el fitxer problemàtic indexant aquest grup en parts: primera part/segona part, la indexació de la part problemàtica es partirà una altra vegada, fins que trobi el fitxer .Això pot trigar fins a 30 minuts d'ús pesat de la CPU. Malauradament, mentre que Baloo no comença a indexar un nou lot de 40 fitxers, quan s'executa amb alimentació per bateria, continuarà intentant determinar el fitxer forçat mentre funciona amb la bateria. Aquest comportament s'ha corregit en les aplicacions del KDE 4.13.1 (aturarà la indexació immediatament quan el cable d'alimentació estigui desendollat​​) i el temps de la cerca per a cada fitxer s'ha reduït a uns 10 minuts. L'equip de la cerca semàntica està treballant en la millora de les eines d'indexació per a manejar fitxers més difícils.
 
;Per què tinc processos nepomukservicestub tot i que he deshabilitat el Nepomuk?
 
:Podria ser un error. Si us plau, presenteu un [http://bugs.kde.org informe d'error] amb una descripció completa del vostre problema i els passos per a reproduir-lo.
 
;La indexació de fitxers PDF i alguns altres tipus de fitxer no funciona.
 
:La indexació de fitxers PDF és un problema conegut i que s'està rastrejant en aquest {{bug/ca|231936}}. Si teniu problemes amb altres fitxers, obriu un error, preferiblement afegint un fitxer d'exemple que mostri el problema.
 
;El programa nepomukservicestub es bloqueja a l'inici.
 
:Un gran nombre de solucions per als bloqueigs han estat solucionades per a la versió 4.7.2 de les àrees de treball i aplicacions del KDE. Si en trobeu més, si us plau, envieu informes d'error amb instruccions detallades sobre com reproduir el problema, ja que de vegades els desenvolupadors no són capaços de provocar-los en les seves configuracions de prova.
 
;El procés virtuoso-t es bloqueja en un 100% de la CPU.
 
:Virtuoso-t és un component clau de l'antiga infraestructura de la cerca semàntica i en algunes ocasions les ordres enviades pels altres components acaben prenent massa temps (per tant, mostra l'efecte amb la CPU al 100%).
 
Ja no s'utilitza el Virtuoso per a la cerca semàntica a partir de les aplicacions 4.13.
 
;De vegades el Nepomuk consumeix massa memòria RAM.
 
:Molts d'aquests problemes s'han solucionat, en altres casos, però, els desenvolupadors no són capaços de reproduir els problemes correctament. En aquest cas, el proveir-los d'exemples i casos de prova als [http://bugs.kde.org/ informes d'error] augmenta les possibilitats d'obtenir una solució.
 
;La cerca accedeix massa al disc durant l'arrencada:
 
:S'ha implementat un mecanisme de limitació en l'indexador de fitxers, les versions posteriors al KDE SC 4.8 ja no haurien de tenir aquest problema.
 
;La meva base de dades de cerca s'ha corromput. Com la netejo?
 
:En el cas extrem que la vostra base de dades estigui molt corrupta i tots els altres intents hagin fracassat, podeu eliminar el directori <tt>$KDEHOME/share/apps/nepomuk</tt> (on <tt>$KDEHOME</tt> sol ser <tt>.kde</tt> o <tt>.kde4</tt> al vostre directori d'inici) mentre no s'està executant el Nepomuk. La base de dades s'esborrarà, però també es perdrà la informació existent, com les etiquetes, les puntuacions i els comentaris.
 
== Solució de problemes avançada ==
 
==Compartir i privacitat==
 
Solament vull afegir una cosa més abans d'indicar altres fonts d'informació: intercanvi de les dades de Nepomuk. Seria genial si les vostres marques, puntuacions i comentaris poguessin ser compartits amb els altres quan els envieu els fitxers. No obstant, si heu marcat un contacte amb alguna marca una mica compromesa («avorrit en el llit») i li envieu aquesta informació de contacte personal a un amic en comú és probable que no vulgueu enviar-li també aquesta marca...
 
Aquest problema s'està considerant i és un tema important d'investigació per part dels investigadors de Nepomuk. De moment, aquestes preocupacions sobre la privadesa, combinades amb reptes tècnics, són el motiu que la informació de Nepomuk sigui privada. Tingueu la seguretat que l'equip de Nepomuk fa tot el possible per respectar la vostra privadesa.
 
== Enllaços externs ==
 
La nova tecnologia de cerca (després de les aplicacions KDE 4.13):
* [http://dot.kde.org/2014/02/24/kdes-next-generation-semantic-search Article amb informació per a usuaris en el «DOT»]
* [http://community.kde.org/Baloo Informació per a programadors a community.kde.org]
* [http://en.wikipedia.org/wiki/Semantic_desktop Viquipèdia: Escriptori semàntic]
 
L'antiga tecnologia de cerca:
* [http://techbase.kde.org/Projects/Nepomuk Pàgines de Nepomuk per als desenvolupadors sobre KDE TechBase]
* [http://nepomuk.kde.org/discover/user Lloc KDE de NEPOMUK]
* [http://en.wikipedia.org/wiki/NEPOMUK_(framework)  Wikipedia - NEPOMUK Framework]
* [http://nepomuk.semanticdesktop.org/nepomuk/ Lloc web de NEPOMUK]
* [http://dot.kde.org/2009/12/10/exploring-new-nepomuk-features-mandriva-linux-2010 Article explicant el Nepomuk en el «DOT»]
* [http://kdenepomukmanual.wordpress.com Manual d'usuari d'introducció]
 
[[Category:Sistema/ca]]

Latest revision as of 23:25, 17 February 2020

Cerca semàntica

L'objectiu d'aquesta pàgina no és explicar plenament la tecnologia de la cerca semàntica del KDE i cada detall, però ens donarà una breu visió general, alguns exemples, comparteix el que hi ha al darrere i enllaça a informació pertinent al web.

Baloo és la següent generació de la cerca semàntica

A partir de les aplicacions del KDE 4.13, el marc de treball per a la indexació i cerca de fitxers del 'Baloo' substitueix al Nepomuk. Llegiu els detalls sobre els canvis per a les aplicacions 4.13. La cerca semàntica ja no utilitza una sola gran base de dades, sinó bases de dades independents i especialitzades per a cada tipus de dades. Les bases de dades de la nova cerca es troben a $HOME/.local/share/baloo. Si heu actualitzat a les aplicacions KDE 4.13 des d'una versió anterior del KDE, podeu eliminar $KDEHOME/share/apps/nepomuk.

Una breu explicació

Tal com esmenta el Glossari, la cerca semàntica tracta la classificació, organització i presentació de les dades. No és una aplicació, sinó un component que poden utilitzar els desenvolupadors dins de les aplicacions.

Proveu en el Dolphin

Per exemple, el gestor de fitxers Dolphin fa ús de la cerca. En les aplicacions del KDE, la cerca semàntica de versions anteriors a la 4.13 han d'estar activada a Arranjament del sistema -> Cerca a l'escriptori. La barra d'informació de Dolphin (Control -> Plafons -> Informació, o premeu F11) presenta informació extreta per la cerca sobre el fitxer seleccionat, i us permetrà assignar etiquetes, valoracions i comentaris als fitxers. Aquesta informació és emmagatzemada i catalogada per la cerca. A continuació, podeu cercar metadades utilitzant la barra de navegació de Dolphin. Feu clic a Cerca o premeu Ctrl + F i cerqueu per noms de fitxer o contingut del fitxer.


Funcionalitats

La cerca semàntica del KDE ofereix diverses «capes» de funcionalitat per a les aplicacions. La primera i més simple d'elles és l'etiquetatge manual, valoracions i comentaris, com s'usen en Dolphin. Això us ajudarà a trobar els fitxers més ràpidament, però també suposa molt treball.

Per a facilitar la cerca de fitxers que continguin un cert text, la cerca ofereix una segona funcionalitat: indexar el text dels fitxers. Podeu cercar fitxers introduint algunes paraules que sabeu que hi són, o simplement el seu títol (o una part d'aquest).

La tercera capa és molt més complexa, i el motiu és que la tecnologia subjacent, Nepomuk, ha estat concebuda com un projecte d'investigació de diverses companyies i universitats de la Unió Europea. Aquí trobareu paraules difícils com «escriptori semàntic» i «ontologies». Bàsicament, es tracta de contextos i relacions.

Indexació de fitxers

La cerca no indexa tots els fitxers que hi ha al disc dur. La seva configuració per omissió en la majoria de les distribucions de Linux exclou alguns patrons comuns per als fitxers de còpia de seguretat i directoris de configuració. Ho podeu canviar a Arranjament del sistema -> Cerca a l'escriptori. Afegiu les carpetes a excloure. Si voleu desactivar completament la indexació dels fitxers, només hi heu d'afegir la vostra carpeta d'inici.

En Arranjament del sistema també podeu controlar si la cerca indexarà els fitxers als suports extraïbles com ara unitats USB i CD-ROM. A les aplicacions del KDE 4.13 això no està disponible, els suports extraïbles no s'indexen. En futures versions s'està planificant el reintroduir aquesta funcionalitat.

Exemples

Permetin-me mirar d'explicar què ofereix la cerca semàntica usant dos exemples. Aquestes característiques encara no estan completament disponibles -la base hi és, però els desenvolupadors d'aplicacions necessiten integrar-la a les seves aplicacions-.

Relacions

Diguem que heu rebut una fotografia d'un amic, fa dues setmanes, i l'heu desada en algun lloc al vostre ordinador. Com trobareu ara aquest fitxer? Tret que sapigueu la ubicació, no té bona pinta.

La cerca semàntica té com a objectiu ajudar-vos. Sabeu que aquest fitxer us el va enviar aquest amic, però el vostre ordinador no. La cerca, no obstant, pot recordar aquesta relació. De manera que en cercar el nom de l'amic aparegui la fotografia!

Una altra possible relació és entre una pàgina web de la qual heu copiat text i el document en el qual l'heu enganxat, o dues imatges mostrant el mateix cotxe. Aquestes relacions de vegades poden ser extretes dels propis fitxers (podeu analitzar fotografies i veure qui o què hi apareix) o proporcionades per les aplicacions involucrades (com en l'anterior exemple sobre correu electrònic). Aquesta part de la cerca està encara sota un fort desenvolupament, i necessita integració amb les aplicacions, per la qual cosa pot trigar uns quants anys fins que de debò brilli.

En conjunt, aquesta part de la cerca semàntica tracta de fer cerques intel·ligents. Pensa sobre com Google intenta ser intel·ligent amb les teves cerques: quan cerqueu un hotel i el nom d'una ciutat, mostra sobre els resultats d'un lloc web un mapa que mostra hotels a la ciutat esmentada. Fins i tot pot suggerir-vos un nom millor en el cas que hageu comès un error ortogràfic. Google també mira de posar la informació més apropiada al començament de la llista de resultats, utilitzant complexos càlculs sobre relacions (enllaços) entre pàgines web. La cerca semàntica serà capaç d'oferir aquest tipus de resultats intel·ligents i ordenar-los segons la seva adequació utilitzant la informació sobre relacions.

Contextos

Aquestes relacions no solament poden ajudar-vos a cercar fitxers, sinó que també tenen influència en les aplicacions i en la informació que presenten. Tingueu en compte que aquesta forma d'usar la cerca és més una visió que una realitat! Molts dels components estan en el seu lloc, però no han estat integrats en les aplicacions ni en l'escriptori en el seu conjunt.

Vet aquí un exemple de com el portar la informació contextual al vostre escriptori pot ajudar-vos a treballar de forma més eficient.

Diguem que esteu treballant per acabar algunes notes agafades en una reunió. Sona el telèfon i algú us demana si podeu cercar el full de càlcul amb preus i adaptar-lo a un client. Després d'algunes interrupcions més descobriu que el vostre escriptori està ple de fitxers i finestres...

Estaria bé poder-ho organitzar tot una mica millor, oi?

Entren en joc les «activitats». Aquestes han estat introduïdes en Plasma, i actualment ofereixen diferents «escriptoris». Són similars als escriptoris virtuals, però on el que canvia és l'escriptori en si, no les aplicacions. Conté diferents estris, fons de pantalla i coses així. Per descomptat, des de Plasma 4.3, cada escriptori virtual pot tenir la seva pròpia activitat, amb els dos en sincronia.

Si les aplicacions i l'escriptori estiguessin al tant de les activitats, podríeu crear una activitat per a cadascuna de les tasques en les quals treballeu regularment. Per tant, si normalment canvieu a un full de càlcul amb preus, podeu crear una activitat per a això: posant un estri de Vista de carpeta (o varis) en l'escriptori, afegint una calculadora i un estri de tasques pendents per a seguir la pista del que encara s'ha de canviar. Potser fins i tot un estri de carpetes de correu electrònic mostrant els correus amb preguntes relacionades amb aquest full de càlcul!

Tan aviat com algú faci una pregunta sobre preus, canvieu a aquesta activitat, i ja podeu treballar amb la vostra aplicació de fulls de càlcul. És conscient de la vostra activitat pel que us mostra fulls de càlcul de preus recents, no la recent llista de l'inventari en la qual esteu treballant en una altra activitat! Kopete, l'aplicació de xat, ens mostra als companys que ho saben tot sobre els preus, ja que són les persones amb les quals parleu sempre que treballeu en aquesta activitat.

Quan acabeu, torneu a l'altra activitat i una vegada més totes les aplicacions ajustaran el seu comportament al que estigueu fent.

Els beneficis d'aquesta forma de treball basada en activitats van més enllà del que pugueu esperar al principi. No solament us ajuda a trobar els vostres fitxers i contactes, també a commutar tasques per si mateix. El cervell humà no és molt bo amb tasques múltiples -a la majoria de la gent li porta uns minuts agafar velocitat després de canviar de tasca-. El canvi d'«entorn» ho agilitza, fins i tot si només esteu a la pantalla. Compareu-ho amb l'alegria de fer les maletes per anar-vos-en de vacances!

Per descomptat, l'anterior sobretot serà apropiat per a la gent que treballa amb el seu ordinador en una oficina o a casa. Un jugador o un usuari informal probablement no utilitzaran aquestes activitats.

L'escenari descrit anteriorment ja s'implementa parcialment en les activitats, però encara queda molta feina per fer.

Preguntes més freqüents

El següent s'ha agafat d'un missatge dels fòrums del KDE. Si us plau, sou lliure d'afegir/treure/modificar els detalls, si teniu temps!

Què és l'escriptori semàntic del Nepomuk, i l'indexador de fitxers de l'escriptori Strigi?
Nepomuk i Strigi formen part de les tecnologies del que ofereixen les capacitats de la cerca semàntica al KDE. Ambdós no són utilitzats directament en l'última generació de la cerca semàntica del KDE (detalls), però, els seus successors comparteixen gran part del seu codi i conceptes. La cerca semàntica proporciona una forma d'organitzar, anotar i construir les relacions entre les dades (no només el nom de fitxer i el contingut, sinó per exemple les aplicacions que utilitzen un determinat fitxer, o com és etiquetat aquest fitxer). Una sèrie d'aplicacions i espais de treball del KDE utilitzen aquesta infraestructura bàsica per oferir característiques com ara l'etiquetatge del correu electrònic (KMail) o l'activitat d'arranjament (Plasma).
La indexació de fitxers permet a les aplicacions, com ara Dolphin poder cercar fitxers basant-se en el contingut, el nom, o altres meta-dades (per exemple, etiquetes) associades als fitxers indexats. Com un indexador també pot indexar fitxers sense text, com fitxers PDF, accedint a les meta-dades contingudes en aquests fitxers (autor, informació sobre publicació, etc.) Alguns components del KDE aporten «analitzadors» addicionals per a més tipus de fitxer.
Per què necessitem Akonadi i la cerca semàntica? No fan el mateix?
En resum, Akonadi proporciona una memòria cau de les dades PIM, com els elements de calendari, contactes i correu electrònic, el qual és utilitzat per les aplicacions com el KMail i KOrganizer, així com pel calendari integrat al Plasma. La cerca semàntica es connecta amb Akonadi per a proporcionar la funcionalitat de cerca. El mètode en el que Baloo ofereix la cerca és en realitat determinat per l'aplicació. En el cas de la informació PIM del KDE, s'utilitza Xapian per a proporcionar la indexació i la cerca.
Com puc deshabilitar l'escriptori semàntic?
La indexació de fitxers es pot desactivar mitjançant l'addició de la carpeta d'inici de l'usuari per a la Arranjament del sistema -> Cerca a l'escriptori -> No cerquis en aquestes ubicacions. L'altra funcionalitat forma part de les aplicacions que l'utilitzen i per tant no es poden deshabilitar sense paralitzar aquestes aplicacions. Per exemple, per no tenir cap cerca al KMail haureu d'esborrar el KMail...

En les versions de les aplicacions KDE abans del 4.13, la cerca semàntica tenia components executant-se independentment de les aplicacions. Aquesta funcionalitat es pot deshabilitar desmarcant Activa l'indexador de fitxers Nepomuk a la secció de Cerca a l'escriptori de Arranjament del sistema. Si voleu desactivar totes les característiques semàntiques, desmarqueu Activa l'escriptori semàntic del Nepomuk. Tingueu en compte que això també desactivarà la cerca al Dolphin.

Tingueu en compte que amb l'última opció alguns programes que utilitzen la cerca semàntica per a les meta-dades oferiran una funcionalitat reduïda: Per exemple, el KMail no serà capaç d'etiquetar el correu o les activitats de Plasma no oferiran característiques addicionals com les icones, o informació de dades als programes.
Baloo/Cerca semàntica és mengen el 100% de la CPU! Què faig?
Simplement espereu. Certs fitxers són molt difícils o fins i tot impossibles d'indexar. Ara mateix, això inclou, per exemple, fitxers de text de més de 50 megabytes .Quan la cerca els troba, ho intentarà durant un temps fix. Quan falla , intentarà esbrinar quin fitxer està forçat i desactivarà la seva indexació en el futur. Com els fitxers són indexats per lots d'uns 40, haurà de trobar el fitxer problemàtic indexant aquest grup en parts: primera part/segona part, la indexació de la part problemàtica es partirà una altra vegada, fins que trobi el fitxer .Això pot trigar fins a 30 minuts d'ús pesat de la CPU. Malauradament, mentre que Baloo no comença a indexar un nou lot de 40 fitxers, quan s'executa amb alimentació per bateria, continuarà intentant determinar el fitxer forçat mentre funciona amb la bateria. Aquest comportament s'ha corregit en les aplicacions del KDE 4.13.1 (aturarà la indexació immediatament quan el cable d'alimentació estigui desendollat​​) i el temps de la cerca per a cada fitxer s'ha reduït a uns 10 minuts. L'equip de la cerca semàntica està treballant en la millora de les eines d'indexació per a manejar fitxers més difícils.
Per què tinc processos nepomukservicestub tot i que he deshabilitat el Nepomuk?
Podria ser un error. Si us plau, presenteu un informe d'error amb una descripció completa del vostre problema i els passos per a reproduir-lo.
La indexació de fitxers PDF i alguns altres tipus de fitxer no funciona.
La indexació de fitxers PDF és un problema conegut i que s'està rastrejant en aquest bug #231936. Si teniu problemes amb altres fitxers, obriu un error, preferiblement afegint un fitxer d'exemple que mostri el problema.
El programa nepomukservicestub es bloqueja a l'inici.
Un gran nombre de solucions per als bloqueigs han estat solucionades per a la versió 4.7.2 de les àrees de treball i aplicacions del KDE. Si en trobeu més, si us plau, envieu informes d'error amb instruccions detallades sobre com reproduir el problema, ja que de vegades els desenvolupadors no són capaços de provocar-los en les seves configuracions de prova.
El procés virtuoso-t es bloqueja en un 100% de la CPU.
Virtuoso-t és un component clau de l'antiga infraestructura de la cerca semàntica i en algunes ocasions les ordres enviades pels altres components acaben prenent massa temps (per tant, mostra l'efecte amb la CPU al 100%).

Ja no s'utilitza el Virtuoso per a la cerca semàntica a partir de les aplicacions 4.13.

De vegades el Nepomuk consumeix massa memòria RAM.
Molts d'aquests problemes s'han solucionat, en altres casos, però, els desenvolupadors no són capaços de reproduir els problemes correctament. En aquest cas, el proveir-los d'exemples i casos de prova als informes d'error augmenta les possibilitats d'obtenir una solució.
La cerca accedeix massa al disc durant l'arrencada
S'ha implementat un mecanisme de limitació en l'indexador de fitxers, les versions posteriors al KDE SC 4.8 ja no haurien de tenir aquest problema.
La meva base de dades de cerca s'ha corromput. Com la netejo?
En el cas extrem que la vostra base de dades estigui molt corrupta i tots els altres intents hagin fracassat, podeu eliminar el directori $KDEHOME/share/apps/nepomuk (on $KDEHOME sol ser .kde o .kde4 al vostre directori d'inici) mentre no s'està executant el Nepomuk. La base de dades s'esborrarà, però també es perdrà la informació existent, com les etiquetes, les puntuacions i els comentaris.

Solució de problemes avançada

Compartir i privacitat

Solament vull afegir una cosa més abans d'indicar altres fonts d'informació: intercanvi de les dades de Nepomuk. Seria genial si les vostres marques, puntuacions i comentaris poguessin ser compartits amb els altres quan els envieu els fitxers. No obstant, si heu marcat un contacte amb alguna marca una mica compromesa («avorrit en el llit») i li envieu aquesta informació de contacte personal a un amic en comú és probable que no vulgueu enviar-li també aquesta marca...

Aquest problema s'està considerant i és un tema important d'investigació per part dels investigadors de Nepomuk. De moment, aquestes preocupacions sobre la privadesa, combinades amb reptes tècnics, són el motiu que la informació de Nepomuk sigui privada. Tingueu la seguretat que l'equip de Nepomuk fa tot el possible per respectar la vostra privadesa.

Enllaços externs

La nova tecnologia de cerca (després de les aplicacions KDE 4.13):

L'antiga tecnologia de cerca: