Nepomuk/es: Difference between revisions

From KDE UserBase Wiki
(Updating to match new version of source page)
(Updating to match new version of source page)
Line 1: Line 1:
<languages />  
<languages />  


<span class="mw-translate-fuzzy">
=Nepomuk=
=Nepomuk=
</span>


<span class="mw-translate-fuzzy">
El objetivo de esta página no es explicar de forma exhaustiva la tecnología de Nepomuk y cada detalle, sino dar una visión general, algunos ejemplos, compartir lo que hay detrás de él y enlazar a información relevante en la web.
El objetivo de esta página no es explicar de forma exhaustiva la tecnología de Nepomuk y cada detalle, sino dar una visión general, algunos ejemplos, compartir lo que hay detrás de él y enlazar a información relevante en la web.
</span>
For those looking for 'Nepomuk' or 'Baloo' (new generation search in Applications 4.13): technical details can be found on [http://community.kde.org community.kde.org]. Read [http://dot.kde.org/2014/02/24/kdes-next-generation-semantic-search details on the changes for Applications 4.13 here].


==Breve explicación==
==Breve explicación==


<span class="mw-translate-fuzzy">
Como menciona el [[Special:myLanguage/Glossary#Nepomuk|Glosario]], Nepomuk trata la clasificación, organización y presentación de datos. No es una aplicación sino un componente que puede ser utilizado por los desarrolladores dentro de sus aplicaciones
Como menciona el [[Special:myLanguage/Glossary#Nepomuk|Glosario]], Nepomuk trata la clasificación, organización y presentación de datos. No es una aplicación sino un componente que puede ser utilizado por los desarrolladores dentro de sus aplicaciones
</span>


<span class="mw-translate-fuzzy">
<span class="mw-translate-fuzzy">
Line 19: Line 27:
==Funcionalidades==
==Funcionalidades==


<span class="mw-translate-fuzzy">
Nepomuk ofrece varias 'capas' de funcionalidad para las aplicaciones. La primera y más simple de ellas es el etiquetado manual, valoraciones y comentarios, como se usan en Dolphin. Esto te ayudará a encontrar tus archivos más rápido, pero también supone mucho trabajo.
Nepomuk ofrece varias 'capas' de funcionalidad para las aplicaciones. La primera y más simple de ellas es el etiquetado manual, valoraciones y comentarios, como se usan en Dolphin. Esto te ayudará a encontrar tus archivos más rápido, pero también supone mucho trabajo.
</span>


<span class="mw-translate-fuzzy">
<span class="mw-translate-fuzzy">
Line 25: Line 35:
</span>
</span>


<span class="mw-translate-fuzzy">
La tercera capa es muy compleja, y es la razón de que Nepomuk fuera concebido como un proyecto de investigación de varias compañías y universidades de la Unión Europea. Aquí encontrarás palabras difíciles como 'escritorio semántico' y 'ontologías'. Básicamente, se trata de contextos y relaciones.
La tercera capa es muy compleja, y es la razón de que Nepomuk fuera concebido como un proyecto de investigación de varias compañías y universidades de la Unión Europea. Aquí encontrarás palabras difíciles como 'escritorio semántico' y 'ontologías'. Básicamente, se trata de contextos y relaciones.
</span>


=== Indexing files ===
=== Indexing files ===


Strigi does not index every file on the hard drive. Its default configuration in most Linux distributions excludes some common patterns for backup files and configuration directories, and it only indexes certain directories in your home folder. You can change this in <menuchoice>System Settings -> Desktop Search -> Desktop Query -> Customize index folders… -> Folders to index</menuchoice>.
Search does not index every file on the hard drive. Its default configuration in most Linux distributions excludes some common patterns for backup files and configuration directories. You can change this in <menuchoice>System Settings -> Desktop Search</menuchoice>. Add folders to be excluded. If you want to turn off indexing of files entirely, just add your home folder there.


Note that Strigi as of KDE 4.7 does not follow symbolic links ({{bug|208602}}). Up to KDE 4.9, even if the user selects folders under the symbolic link for indexing ({{bug|287593}}), content will not been indexed. The specific bug has been fixed. Thus, the user will be able to see the symbolic links, but she/he will not be allowed to mark any of them for indexing. (A symbolic link is a file that "points" to another file or directory; Dolphin displays symbolic links in ''italic''.) You must find the path to the actual directory (in '''Dolphin''', select the file, choose <menuchoice>Properties -> General -> Points to</menuchoice>) and tell Strigi to index that.
In '''System Settings''' you can also control whether Search indexes files on removable media such as USB drives and CD-ROMs. In KDE Applications 4.13 this is not available, removable media are not indexed. Future versions are planned to reintroduce this functionality.
 
In '''System Settings''' you can also control whether Strigi indexes files on removable media such as USB drives and CD-ROMs.


==Ejemplos==
==Ejemplos==


<span class="mw-translate-fuzzy">
Déjame que te explique lo que ofrece Nepomuk con dos ejemplos.
Déjame que te explique lo que ofrece Nepomuk con dos ejemplos.
</span>


===Relaciones===
===Relaciones===
Line 43: Line 55:
Digamos que has recibido una foto de un amigo tuyo, hace dos semanas, y la guardaste en algún lugar en tu ordenador. ¿Cómo encuentras ese archivo ahora? A menos que sepas la ubicación, no tiene buena pinta.
Digamos que has recibido una foto de un amigo tuyo, hace dos semanas, y la guardaste en algún lugar en tu ordenador. ¿Cómo encuentras ese archivo ahora? A menos que sepas la ubicación, no tiene buena pinta.


<span class="mw-translate-fuzzy">
Nepomuk tiene como objetivo ayudarte. Tú sabes que este archivo vino de ese amigo tuyo, pero tu equipo no. Nepomuk, sin embargo, puede recordar esta relación, ¡de forma que al buscar el nombre de tu amigo aparezca la foto!
Nepomuk tiene como objetivo ayudarte. Tú sabes que este archivo vino de ese amigo tuyo, pero tu equipo no. Nepomuk, sin embargo, puede recordar esta relación, ¡de forma que al buscar el nombre de tu amigo aparezca la foto!
</span>


<span class="mw-translate-fuzzy">
Otra posible relación es entre una página web de la que has copiado texto y el documento en el que lo has pegado, o dos imágenes mostrando el mismo coche. Estas relaciones a veces pueden ser extraídas de los propios archivos (puedes analizar fotografías y ver quien o qué aparece en ella) o proporcionadas por las aplicaciones involucradas (como en el ejemplo sobre correo electrónico anterior). Esta parte de Nepomuk está todavía bajo un fuerte desarrollo, y necesita integración con las aplicaciones, por lo que puede tardar unos cuantos años hasta que de verdad brille.
Otra posible relación es entre una página web de la que has copiado texto y el documento en el que lo has pegado, o dos imágenes mostrando el mismo coche. Estas relaciones a veces pueden ser extraídas de los propios archivos (puedes analizar fotografías y ver quien o qué aparece en ella) o proporcionadas por las aplicaciones involucradas (como en el ejemplo sobre correo electrónico anterior). Esta parte de Nepomuk está todavía bajo un fuerte desarrollo, y necesita integración con las aplicaciones, por lo que puede tardar unos cuantos años hasta que de verdad brille.
</span>


<span class="mw-translate-fuzzy">
En conjunto, esta parte de Nepomuk trata de hacer búsquedas inteligentes. Piensa acerca de cómo Google intenta ser inteligente con tus búsquedas: cuando buscas por un hotel y el nombre de una ciudad, muestra sobre los resultados un mapa que muestra hoteles en la ciudad mencionada. Incluso puede sugerirte un mejor nombre en caso de que hayas cometido un error ortográfico. Google también trata de poner la información mas relevante al principio de la lista de resultados, utilizando complejos cálculos sobre relaciones (enlaces) entre páginas web. Nepomuk será capaz de ofrecer este tipo de resultados inteligentes y ordenarlos según relevancia utilizando la información sobre relaciones.
En conjunto, esta parte de Nepomuk trata de hacer búsquedas inteligentes. Piensa acerca de cómo Google intenta ser inteligente con tus búsquedas: cuando buscas por un hotel y el nombre de una ciudad, muestra sobre los resultados un mapa que muestra hoteles en la ciudad mencionada. Incluso puede sugerirte un mejor nombre en caso de que hayas cometido un error ortográfico. Google también trata de poner la información mas relevante al principio de la lista de resultados, utilizando complejos cálculos sobre relaciones (enlaces) entre páginas web. Nepomuk será capaz de ofrecer este tipo de resultados inteligentes y ordenarlos según relevancia utilizando la información sobre relaciones.
</span>


===Contexto===
===Contexto===


<span class="mw-translate-fuzzy">
Estas relaciones no solo pueden ayudarte a buscar archivos, sino que también tienen influencia en las aplicaciones y en la información que presentan. ¡Ten en cuenta que esta forma de usar Nepomuk es más una visión que una realidad! Muchos de los componentes están en su sitio, pero no han sido integrados en las aplicaciones ni en el escritorio en su conjunto.
Estas relaciones no solo pueden ayudarte a buscar archivos, sino que también tienen influencia en las aplicaciones y en la información que presentan. ¡Ten en cuenta que esta forma de usar Nepomuk es más una visión que una realidad! Muchos de los componentes están en su sitio, pero no han sido integrados en las aplicaciones ni en el escritorio en su conjunto.
</span>


Aquí tienes un ejemplo de como llevar la información contextual a tu escritorio puede ayudarte a trabajar de forma más eficiente.
Aquí tienes un ejemplo de como llevar la información contextual a tu escritorio puede ayudarte a trabajar de forma más eficiente.
Line 59: Line 79:
Sería bueno poder organizar todo un poco mejor ¿verdad?
Sería bueno poder organizar todo un poco mejor ¿verdad?


<span class="mw-translate-fuzzy">
Aparecen las '[[Special:myLanguage/Glossary#Actividades|actividades]]'. Estas han sido introducidas en [[Special:myLanguage/Plasma|Plasma]], y actualmente ofrecen distintos 'escritorios'. Son similares a los escritorios virtuales, pero donde lo que cambia es el escritorio en si, no las aplicaciones. Diferentes elementos gráficos, fondo de pantalla y cosas así. Por supuesto, desde KDE 4.3, cada escritorio virtual puede tener su propia actividad, con los dos en sincronía.
Aparecen las '[[Special:myLanguage/Glossary#Actividades|actividades]]'. Estas han sido introducidas en [[Special:myLanguage/Plasma|Plasma]], y actualmente ofrecen distintos 'escritorios'. Son similares a los escritorios virtuales, pero donde lo que cambia es el escritorio en si, no las aplicaciones. Diferentes elementos gráficos, fondo de pantalla y cosas así. Por supuesto, desde KDE 4.3, cada escritorio virtual puede tener su propia actividad, con los dos en sincronía.
</span>


Si las aplicaciones y el escritorio estuvieran al tanto de las actividades, podrías crear una actividad para cada una de las tareas en las que trabajes regularmente. Por tanto, si normalmente cambias a una hoja de cálculo con precios, puedes crear una actividad para eso: pon un elemento de Vista de Carpeta (o varios) en el escritorio, añade una calculadora y un elemento de tareas pendientes para seguir la pista de lo que aún debes cambiar. ¡Quizás incluso un elemento de carpetas de correo electrónico mostrando los correos con preguntas relacionadas con esa hoja de cálculo!
Si las aplicaciones y el escritorio estuvieran al tanto de las actividades, podrías crear una actividad para cada una de las tareas en las que trabajes regularmente. Por tanto, si normalmente cambias a una hoja de cálculo con precios, puedes crear una actividad para eso: pon un elemento de Vista de Carpeta (o varios) en el escritorio, añade una calculadora y un elemento de tareas pendientes para seguir la pista de lo que aún debes cambiar. ¡Quizás incluso un elemento de carpetas de correo electrónico mostrando los correos con preguntas relacionadas con esa hoja de cálculo!
Line 71: Line 93:
Por supuesto, lo anterior es sobre todo relevante para la gente que trabaja con su ordenador en una oficina o en casa. Un jugador o un usuario casual probablemente no utilizarán estas actividades.
Por supuesto, lo anterior es sobre todo relevante para la gente que trabaja con su ordenador en una oficina o en casa. Un jugador o un usuario casual probablemente no utilizarán estas actividades.


<span class="mw-translate-fuzzy">
Ten en cuenta que el escenario descrito arriba está todavía a años luz de la realidad. Gran parte de la infraestructura para esto en KDE está en su sitio pero todavía hay mucho que hacer.
Ten en cuenta que el escenario descrito arriba está todavía a años luz de la realidad. Gran parte de la infraestructura para esto en KDE está en su sitio pero todavía hay mucho que hacer.
</span>


==Frequently Asked Questions==
==Frequently Asked Questions==
Line 79: Line 103:
;What is the Nepomuk Semantic Desktop, and the Strigi Desktop File Indexer?
;What is the Nepomuk Semantic Desktop, and the Strigi Desktop File Indexer?


:The Nepomuk Semantic Desktop is the foundation of the all the other modules of the Nepomuk infrastructure. It provides a way to organize, annotate and build relationships among the data (not only file name and content, but for example which applications used a certain file, or how it is tagged). A number of KDE applications and workspaces use this basic infrastructure to deliver features such as email tagging ([[Special:myLanguage/KMail|KMail]]) or activity setup (Plasma).  
: Nepomuk and Strigi are technologies part of what delivers the abilities of the Semantic Search in KDE. Both are not used directly in the latest generation of KDE's Semantic Search ([http://dot.kde.org/2014/02/24/kdes-next-generation-semantic-search details]), however their successors share much of their code and concepts. Semantic Search provides a way to organize, annotate and build relationships among the data (not only file name and content, but for example which applications used a certain file, or how it is tagged). A number of KDE applications and workspaces use this basic infrastructure to deliver features such as email tagging ([[Special:myLanguage/KMail|KMail]]) or activity setup (Plasma).  


:On the other hand, the Strigi Desktop File Indexer is a system to index files so that they can be added to the main Nepomuk repository, a convenient way to use them within Nepomuk without adding any file manually. Also, applications such as [[Special:myLanguage/Dolphin|Dolphin]] can then search for files basing on content, name, or other meta-data (e.g. tags) associated to indexed files. Such an indexer can also index non-text files, such as PDFs, by accessing the meta-data contained in these files (author, publication information, etc.). Some KDE components ship additional "analyzers" for more file types. Nepomuk can be fully functional without the use of the File Indexer, which is an additional (and optional) component.
:The file indexing allows applications such as [[Special:myLanguage/Dolphin|Dolphin]] to search for files based on content, name, or other meta-data (e.g. tags) associated to indexed files. Such an indexer can also index non-text files, such as PDFs, by accessing the meta-data contained in these files (author, publication information, etc.). Some KDE components ship additional "analyzers" for more file types.


; Why do we need both Akonadi and Nepomuk?  Aren't they doing the same thing?
; Why do we need both Akonadi and Semantic Search?  Aren't they doing the same thing?


:There is often a good deal of confusion about Akonadi and Nepomuk. [http://cmollekopf.wordpress.com/2013/02/13/kontact-nepomuk-integration-why-data-from-akonadi-is-indexed-in-nepomuk/ Why data from Akonadi is indexed in Nepomuk] explains exactly why we have both, and what their roles are.  Don't miss the additional information from [http://en.opensuse.org/User:Wstephenson Will Stephenson] in the Comments section.
: In short, Akonadi provides a cache of PIM data like calendar items, contacts and email, which is used by applications like KMail and Korganizer but also the calendar build in Plasma. Semantic Search plugs in Akonadi to provide search functionality. How Baloo offers search is actually up to the application. In case of KDE PIM, Xapian is used to provide indexing and search.


;How can I disable the semantic desktop?
;How can I disable the semantic desktop?


:Most of the times, the easiest way is to disable file indexing, which is usually, among the Nepomuk components, the heavier in resource usage (although many optimizations were included in the 4.7 release which has reduced resource usage). This is done by unchecking <menuchoice>Enable Nepomuk File Indexer</menuchoice> in the [[Special:myLanguage/System_Settings/Search_Desktop|Desktop Search]] section of [[Special:myLanguage/System Settings|System Settings]]. In case you want to turn off all semantic features, uncheck <menuchoice>Enable Nepomuk Semantic Desktop</menuchoice>. Notice that this will turn off search in [[Special:myLanguage/Dolphin|Dolphin]] as well.
: File indexing can be disabled by adding the users' home folder to the <menuchoice>System Settings -> Desktop Search -> Do not search in these locations list</menuchoice>. The other functionality is part of the applications that use it and thus can't be disabled without crippling these applications. For example, to not have any search in KMail you'll have to simply remove KMail...
 
In versions of the KDE Applications 4.13, Semantic Search would have components running separate from applications. This functionality could be disabled by unchecking <menuchoice>Enable Nepomuk File Indexer</menuchoice> in the [[Special:myLanguage/System_Settings/Search_Desktop|Desktop Search]] section of [[Special:myLanguage/System Settings|System Settings]]. In case you want to turn off all semantic features, uncheck <menuchoice>Enable Nepomuk Semantic Desktop</menuchoice>. Notice that this will turn off search in [[Special:myLanguage/Dolphin|Dolphin]] as well.


:Notice that with the latter option some programs who use Nepomuk for meta-data will offer reduced functionality: for example [[Special:myLanguage/KMail|KMail]] will not be able to tag mail, or Plasma activities will not offer additional features such as icons, or program data information.  
:Notice that with the latter option some programs who use Semantic Search for meta-data will offer reduced functionality: for example [[Special:myLanguage/KMail|KMail]] will not be able to tag mail, or Plasma activities will not offer additional features such as icons, or program data information.  


;Why do I have nepomukservicestub processes even though I've disabled Nepomuk?
;Why do I have nepomukservicestub processes even though I've disabled Nepomuk?
Line 107: Line 133:
;The virtuoso-t process hangs at 100% CPU.
;The virtuoso-t process hangs at 100% CPU.


:Virtuoso-t is a key component of the Nepomuk infrastructure and in some occasions the commands sent by the other components end up taking too much time (hence showing the effect of 100% CPU). Sebastian Trüg (the lead developer of Nepomuk) has fixed most of these problems in 4.7.1 or newer.
:Virtuoso-t is a key component of the old Semantic Search infrastructure and in some occasions the commands sent by the other components end up taking too much time (hence showing the effect of 100% CPU).
 
Virtuoso is no longer used by Semantic Search starting the Applications 4.13 release.


;Sometimes Nepomuk consumes too much RAM.
;Sometimes Nepomuk consumes too much RAM.
Line 113: Line 141:
:Many of these problems have been fixed, in other cases however the developers are unable to reproduce the issues correctly. In this case, providing examples and test cases to [http://bugs.kde.org/ bug reports] increase the chances to get these bugs fixed.
:Many of these problems have been fixed, in other cases however the developers are unable to reproduce the issues correctly. In this case, providing examples and test cases to [http://bugs.kde.org/ bug reports] increase the chances to get these bugs fixed.


;Nepomuk re-indexes files at startup.
;Search accesses the disk too much on startup.:


:This bug has been fixed in 4.7.0 versions. Now Nepomuk just "scans" for changes, without indexing anything.
:A throttling mechanism implemented in the file indexer, versions after KDE SC 4.8 should no longer have this issue.


;Nepomuk accesses the disk too much on startup.:
;My Search database has been corrupted. How do I clean it?


:In 4.7 and newer this problem has been lessened thanks to a throttling mechanism implemented in the file indexer.
:In the extreme case your database is really corrupted and all other attempts have failed, you can delete the <tt>$KDEHOME/share/apps/nepomuk</tt> directory (where <tt>$KDEHOME</tt> is usually <tt>.kde</tt> or <tt>.kde4</tt>) while Nepomuk is not running. The database will be cleared, but you will also lose existing information such as tags, ratings and comments.


;My Nepomuk database has been corrupted. How do I clean it?
From KDE Applications 4.13 onwards, Semantic Search no longer uses a single, big database, but separate, specialized databases for each type of data. The search databases can be found in <tt>$KDEHOME/share/apps/baloo</tt>.
 
:In the extreme case your database is really corrupted and all other attempts have failed, you can delete the <tt>$KDEHOME/share/apps/nepomuk</tt> directory (where <tt>$KDEHOME</tt> is usually <tt>.kde</tt> or <tt>.kde4</tt>) while Nepomuk is not running. The database will be cleared, but you will also lose existing information such as tags, ratings and comments.


== Advanced troubleshooting ==
== Advanced troubleshooting ==
If Nepomuk has trouble indexing a file, in a terminal try running
{{Input|1=nepomukindexer ''/path/to/file''}}
and see if there's any useful output. If the file cannot be indexed, the indexer will print an error, but you will only see that error if you have debug messages for Nepomuk enabled (kdebugdialog). If the error is reproducible, please file a bug and upload the file along with the error.
[http://kdeatopensuse.wordpress.com/2011/11/09/debugging-nepomukvirtuosos-cpu-usage/ This blog post] explains how to turn on debugging output from the [[Glossary#Nepomuk|Nepomuk]] service. It also shows how to debug the CPU usage of '''Nepomuk''' and its storage backend.
[http://vhanda.in/blog/2012/02/virtuoso-going-crazy-/ This blog post] explains how to extract useful information for bug reports about the CPU usage of the '''Virtuoso''' backend.


==Compartir y privacidad==  
==Compartir y privacidad==  
Line 150: Line 168:
</span>
</span>


The new Search technology (post KDE Applications 4.13):
* [http://dot.kde.org/2014/02/24/kdes-next-generation-semantic-search user information article on the dot]
* [http://community.kde.org/Baloo Developer information on community.kde.org]
* [http://en.wikipedia.org/wiki/Semantic_desktop Wikipedia - Semantic Desktop]
The old Search technology:
* [http://techbase.kde.org/Projects/Nepomuk Nepomuk pages for developers on KDE TechBase]
* [http://techbase.kde.org/Projects/Nepomuk Nepomuk pages for developers on KDE TechBase]
* [http://nepomuk.kde.org/discover/user NEPOMUK KDE site]
* [http://nepomuk.kde.org/discover/user NEPOMUK KDE site]
* [http://en.wikipedia.org/wiki/Semantic_desktop Wikipedia - Semantic Desktop]
* [http://en.wikipedia.org/wiki/NEPOMUK_(framework)  Wikipedia - NEPOMUK Framework]  
* [http://en.wikipedia.org/wiki/NEPOMUK_(framework)  Wikipedia - NEPOMUK Framework]  
* [http://nepomuk.semanticdesktop.org/nepomuk/ NEPOMUK website]
* [http://nepomuk.semanticdesktop.org/nepomuk/ NEPOMUK website]

Revision as of 06:48, 20 April 2014

Nepomuk

El objetivo de esta página no es explicar de forma exhaustiva la tecnología de Nepomuk y cada detalle, sino dar una visión general, algunos ejemplos, compartir lo que hay detrás de él y enlazar a información relevante en la web.

For those looking for 'Nepomuk' or 'Baloo' (new generation search in Applications 4.13): technical details can be found on community.kde.org. Read details on the changes for Applications 4.13 here.

Breve explicación

Como menciona el Glosario, Nepomuk trata la clasificación, organización y presentación de datos. No es una aplicación sino un componente que puede ser utilizado por los desarrolladores dentro de sus aplicaciones

Pruébalo

Por ejemplo, Dolphin hace uso de Nepomuk. Para lo siguiente Nepomuk y Strigi deben estar activados en System settings -> Búsqueda de Escritorio. La barra lateral de información de Dolphin te permite asignar etiquetas, valoraciones y comentarios a los archivos. Esta información es almacenada en Nepomuk e indexada por Strigi. Puedes buscar por metadatos utilizando la barra de navegación de Dolphin. Escribe "nepomuksearch:/" seguido de los términos de búsqueda.


Funcionalidades

Nepomuk ofrece varias 'capas' de funcionalidad para las aplicaciones. La primera y más simple de ellas es el etiquetado manual, valoraciones y comentarios, como se usan en Dolphin. Esto te ayudará a encontrar tus archivos más rápido, pero también supone mucho trabajo.

Para facilitar la búsqueda de archivos que contengan cierto texto, Nepomuk ofrece una segunda funcionalidad: indexación del texto de los archivos. Utiliza una tecnología llamada Strigi para ésto. Puedes buscar archivos introduciendo algunas palabras que sepas que están ahí o, simplemente, parte de su título.

La tercera capa es muy compleja, y es la razón de que Nepomuk fuera concebido como un proyecto de investigación de varias compañías y universidades de la Unión Europea. Aquí encontrarás palabras difíciles como 'escritorio semántico' y 'ontologías'. Básicamente, se trata de contextos y relaciones.

Indexing files

Search does not index every file on the hard drive. Its default configuration in most Linux distributions excludes some common patterns for backup files and configuration directories. You can change this in System Settings -> Desktop Search. Add folders to be excluded. If you want to turn off indexing of files entirely, just add your home folder there.

In System Settings you can also control whether Search indexes files on removable media such as USB drives and CD-ROMs. In KDE Applications 4.13 this is not available, removable media are not indexed. Future versions are planned to reintroduce this functionality.

Ejemplos

Déjame que te explique lo que ofrece Nepomuk con dos ejemplos.

Relaciones

Digamos que has recibido una foto de un amigo tuyo, hace dos semanas, y la guardaste en algún lugar en tu ordenador. ¿Cómo encuentras ese archivo ahora? A menos que sepas la ubicación, no tiene buena pinta.

Nepomuk tiene como objetivo ayudarte. Tú sabes que este archivo vino de ese amigo tuyo, pero tu equipo no. Nepomuk, sin embargo, puede recordar esta relación, ¡de forma que al buscar el nombre de tu amigo aparezca la foto!

Otra posible relación es entre una página web de la que has copiado texto y el documento en el que lo has pegado, o dos imágenes mostrando el mismo coche. Estas relaciones a veces pueden ser extraídas de los propios archivos (puedes analizar fotografías y ver quien o qué aparece en ella) o proporcionadas por las aplicaciones involucradas (como en el ejemplo sobre correo electrónico anterior). Esta parte de Nepomuk está todavía bajo un fuerte desarrollo, y necesita integración con las aplicaciones, por lo que puede tardar unos cuantos años hasta que de verdad brille.

En conjunto, esta parte de Nepomuk trata de hacer búsquedas inteligentes. Piensa acerca de cómo Google intenta ser inteligente con tus búsquedas: cuando buscas por un hotel y el nombre de una ciudad, muestra sobre los resultados un mapa que muestra hoteles en la ciudad mencionada. Incluso puede sugerirte un mejor nombre en caso de que hayas cometido un error ortográfico. Google también trata de poner la información mas relevante al principio de la lista de resultados, utilizando complejos cálculos sobre relaciones (enlaces) entre páginas web. Nepomuk será capaz de ofrecer este tipo de resultados inteligentes y ordenarlos según relevancia utilizando la información sobre relaciones.

Contexto

Estas relaciones no solo pueden ayudarte a buscar archivos, sino que también tienen influencia en las aplicaciones y en la información que presentan. ¡Ten en cuenta que esta forma de usar Nepomuk es más una visión que una realidad! Muchos de los componentes están en su sitio, pero no han sido integrados en las aplicaciones ni en el escritorio en su conjunto.

Aquí tienes un ejemplo de como llevar la información contextual a tu escritorio puede ayudarte a trabajar de forma más eficiente.

Digamos que estás trabajando en terminar algunas notas que has tomado después de una reunión. Suena el teléfono y alguien te pide que si puedes buscar la hoja de cálculo con precios y adaptarla a un cliente. Después de algunas interrupciones más descubres que tu escritorio está lleno de archivos y ventanas...

Sería bueno poder organizar todo un poco mejor ¿verdad?

Aparecen las 'actividades'. Estas han sido introducidas en Plasma, y actualmente ofrecen distintos 'escritorios'. Son similares a los escritorios virtuales, pero donde lo que cambia es el escritorio en si, no las aplicaciones. Diferentes elementos gráficos, fondo de pantalla y cosas así. Por supuesto, desde KDE 4.3, cada escritorio virtual puede tener su propia actividad, con los dos en sincronía.

Si las aplicaciones y el escritorio estuvieran al tanto de las actividades, podrías crear una actividad para cada una de las tareas en las que trabajes regularmente. Por tanto, si normalmente cambias a una hoja de cálculo con precios, puedes crear una actividad para eso: pon un elemento de Vista de Carpeta (o varios) en el escritorio, añade una calculadora y un elemento de tareas pendientes para seguir la pista de lo que aún debes cambiar. ¡Quizás incluso un elemento de carpetas de correo electrónico mostrando los correos con preguntas relacionadas con esa hoja de cálculo!

Tan pronto como alguien haga una pregunta sobre precios, cambias a estas actividad, y ya puedes trabajar con tu aplicación de hojas de cálculo. ¡Es consciente de tu actividad por lo que te muestra hojas de cálculo de precios recientes, no la reciente lista del inventario en la que estás trabajando en otra actividad! Kopete, la aplicación de chat, muestra a tus colegas que lo saben todo sobre los precios, puesto que son las personas con las que siempre hablas cuando trabajas en esta actividad.

Cuando acabes, vuelves a la otra actividad y una vez más todas las aplicaciones ajustarán su comportamiento a lo que estés haciendo.

Los beneficios de esta forma de trabajo basada en actividades van más allá de lo que puedas esperar en un principio. No solo te ayuda a encontrar tus archivos y contactos, también a conmutar tareas por sí mismo. El cerebro humano no es muy bueno con multitareas - a la mayoría de la gente le lleva unos minutos coger velocidad después de cambiar de tarea. El cambio de 'entorno' agiliza esto, incluso si está solo en la pantalla. ¡Compáralo con alegrarte de hacer las maletas para tus vacaciones!

Por supuesto, lo anterior es sobre todo relevante para la gente que trabaja con su ordenador en una oficina o en casa. Un jugador o un usuario casual probablemente no utilizarán estas actividades.

Ten en cuenta que el escenario descrito arriba está todavía a años luz de la realidad. Gran parte de la infraestructura para esto en KDE está en su sitio pero todavía hay mucho que hacer.

Frequently Asked Questions

The following is taken from a KDE forums post. Please feel free to add/remove/modify details if you have the time!

What is the Nepomuk Semantic Desktop, and the Strigi Desktop File Indexer?
Nepomuk and Strigi are technologies part of what delivers the abilities of the Semantic Search in KDE. Both are not used directly in the latest generation of KDE's Semantic Search (details), however their successors share much of their code and concepts. Semantic Search provides a way to organize, annotate and build relationships among the data (not only file name and content, but for example which applications used a certain file, or how it is tagged). A number of KDE applications and workspaces use this basic infrastructure to deliver features such as email tagging (KMail) or activity setup (Plasma).
The file indexing allows applications such as Dolphin to search for files based on content, name, or other meta-data (e.g. tags) associated to indexed files. Such an indexer can also index non-text files, such as PDFs, by accessing the meta-data contained in these files (author, publication information, etc.). Some KDE components ship additional "analyzers" for more file types.
Why do we need both Akonadi and Semantic Search? Aren't they doing the same thing?
In short, Akonadi provides a cache of PIM data like calendar items, contacts and email, which is used by applications like KMail and Korganizer but also the calendar build in Plasma. Semantic Search plugs in Akonadi to provide search functionality. How Baloo offers search is actually up to the application. In case of KDE PIM, Xapian is used to provide indexing and search.
How can I disable the semantic desktop?
File indexing can be disabled by adding the users' home folder to the System Settings -> Desktop Search -> Do not search in these locations list. The other functionality is part of the applications that use it and thus can't be disabled without crippling these applications. For example, to not have any search in KMail you'll have to simply remove KMail...

In versions of the KDE Applications 4.13, Semantic Search would have components running separate from applications. This functionality could be disabled by unchecking Enable Nepomuk File Indexer in the Desktop Search section of System Settings. In case you want to turn off all semantic features, uncheck Enable Nepomuk Semantic Desktop. Notice that this will turn off search in Dolphin as well.

Notice that with the latter option some programs who use Semantic Search for meta-data will offer reduced functionality: for example KMail will not be able to tag mail, or Plasma activities will not offer additional features such as icons, or program data information.
Why do I have nepomukservicestub processes even though I've disabled Nepomuk?
It may be a bug. Please file a bug report with a complete description of your problem and the steps to trigger it.
File indexing of PDF/some other file types doesn't work.
PDF indexing is a known issue and it's being tracked in bug #231936. If you have issues with other files, open a bug, preferably adding a sample file that shows the problem.
The program nepomukservicestub crashes at startup.
A large number of fixes for crashes has been fixed for the 4.7.2 release of the KDE Workspaces and Applications. If you encounter more, please file bugs report with detailed instructions on how to reproduce the problem, as sometimes the developers are unable to trigger them in their test setups.
The virtuoso-t process hangs at 100% CPU.
Virtuoso-t is a key component of the old Semantic Search infrastructure and in some occasions the commands sent by the other components end up taking too much time (hence showing the effect of 100% CPU).

Virtuoso is no longer used by Semantic Search starting the Applications 4.13 release.

Sometimes Nepomuk consumes too much RAM.
Many of these problems have been fixed, in other cases however the developers are unable to reproduce the issues correctly. In this case, providing examples and test cases to bug reports increase the chances to get these bugs fixed.
Search accesses the disk too much on startup.
A throttling mechanism implemented in the file indexer, versions after KDE SC 4.8 should no longer have this issue.
My Search database has been corrupted. How do I clean it?
In the extreme case your database is really corrupted and all other attempts have failed, you can delete the $KDEHOME/share/apps/nepomuk directory (where $KDEHOME is usually .kde or .kde4) while Nepomuk is not running. The database will be cleared, but you will also lose existing information such as tags, ratings and comments.

From KDE Applications 4.13 onwards, Semantic Search no longer uses a single, big database, but separate, specialized databases for each type of data. The search databases can be found in $KDEHOME/share/apps/baloo.

Advanced troubleshooting

Compartir y privacidad

Solo quiero añadir una cosa más antes de indicar otras fuentes de información: intercambio de los datos de Nepomuk. Sería genial si tus etiquetas, puntuaciones y comentarios pudieran ser compartidos con otros cuando les envías los archivos. Sin embargo, si has etiquetado a un contacto con alguna etiqueta embarazosa ('aburrido en la cama') y le envías esa información de contacto personal a un amigo en común es probable que no quieras enviarle también esa etiqueta...

Este problema está siendo considerado y es un tema importante de investigación por parte de los investigadores de Nepomuk. Por el momento, estas preocupaciones sobre la privacidad, combinadas con retos técnicos, son la razón de que la información de Nepomuk sea privada. Ten la seguridad de que el equipo de Nepomuk hace todo lo posible para respetar tu privacidad.

Más información:
Wikipedia (Inglés) - Semantic Desktop
Wikipedia - NEPOMUK
Página web de NEPOMUK
Sitio en KDE de NEPOMUK
Artículo que explica Nepomuk en el DOT

The new Search technology (post KDE Applications 4.13):

The old Search technology: