LinkedIn capitalise sur nos données… Pourquoi pas nous?

Il y a quelques années je faisais ma veille tech sur Twitter, c’était vraiment cool, puis progressivement depuis la bascule sur X, je me suis tourné vers LinkedIn. Alors oui, LinkedIn, c’est souvent beaucoup de bullshit et de contenu généré par IA… Mais c’est aussi plein de professionnels qui partagent des articles et des réflexions intéressantes. Je me suis rendu compte que j’accumulais énormément de publications enregistrées sans réellement réussir à les réexploiter.

En plus, il n’y a pas de recherche possible sur ces articles. Je me suis donc trouvé une solution, mais je ne voulais pas labelliser manuellement l’ensemble de ces contenus pour en faire une base de connaissances, ça aurait été extrêmement complexe et chronophage. Par contre les récupérer puis s’appuyer sur les capacités d’un LLM pour les exploiter me paraissait être une solution intéressante. Après tout, un LLM c’est assez efficace pour synthétiser, structurer et contextualiser de l’information. Donc ce que je vous présente, c’est plus une démarche faite avec 2-3 prompts pour essayer déjà de voir si sur les 700+ posts enregistrés peuvent être exploités après le traitement du LLM. Si j’arrive à identifier un usage réellement pertinent et exploitable à partir du corpus constitué, j’ai bien l’intention de poursuivre le travail en concevant une solution plus aboutie avec une BDD, des dictionnaires…

Pour sauvegarder les posts LinkedIn j’utilise le plugin chrome LinkedIn Saved Posts Exporter. De là je récupère un csv avec l’ensemble des liens.
Pour enregistrer les pages en local, j’utilise l’extension Single File À partir de l’extraction des liens de LinkedIn Saved Posts exporter, j’utilise le mode batch de single file pour télécharger les posts:

Je renomme tous les fichiers avec des uuids avec un petit script.

rename-html-file.sh

J’ai créé un skill pour retravailler les documents en markdown dans un format structuré: https://gist.github.com/clement-software/59f32713b07233c8a07c9a8b716f0ddc

J’ai un script qui boucle en utilisant l’API Claude avec le modèle Haiku 4.5 en parcourant l’ensemble des fichiers html.

Voici un exemple de fichier markdown issu du traitement:

Dans Obsidian je me retrouve avec un beau graph en activant l’affichage sur les tags:

Je peux voir que dans la taxonomie, j’ai logiquement beaucoup d’articles qui parlent d’architecture logicielle:

Bon c’est une bonne première étape, j’ajoute un petit moteur de recherche pour tester directement dans mon vault avec Omnisearch for Obsidian

Pour mon skill j’adapte les poids pour le moteur de recherche en y ajoutant les propriétés personnalisées qui sont propres à ma structure de fichiers générés.

Maintenant, je vais améliorer l’usage en permettant de lier le contexte du LLM à cette source de données en utilisant le serveur MCP https://github.com/cyanheads/obsidian-mcp-server. Ce qui est intéressant c’est qu’il y a le tool obsidian_search_notes permet d’utiliser la recherche BM25-ranked quand le plugin Omnisearch est activé, pour ça il faut démarrer le serveur sur le port 51361 depuis les paramètres du plugin.

Il faut aussi installer le plugin Local REST API (port 27123) en cochant dans la configuration du plugin Enable non-encrypted (http) server https://github.com/coddingtonbear/obsidian-local-rest-api

Dans le plugin il faut récupérer le token Bearer 4cd7869CCCXXXXX….

Et configurer le serveur MCP dans la configuration de l’outil claude par exemple avec uniquement des accès en lecture avec une configuration dans ~/.claude/settings.json qui ressemble à:

"obsidian": {
	  "command": "/opt/homebrew/bin/npx",
      "args": ["-y", "obsidian-mcp-server@latest"],
      "env": {
        "MCP_TRANSPORT_TYPE": "stdio",
        "MCP_LOG_LEVEL": "info",
        "OBSIDIAN_API_KEY": "4cd7869CCCXXXXX....",
        "OBSIDIAN_READ_ONLY": "true"
      }
    }

Si en faisant un /mcp après avoir redémarré claude et qu’il n’apparait pas après redémarrage de Claude, il faut utiliser la commande claude mcp add-json.

Je peux maintenant interroger le LLM pour retrouver de l’information utile que je laissais vivre sur LinkedIn et intégrer cette connaissance à mes projets:

L’approche est intéressante, je m’amuserais bien à la généraliser à d’autres plateformes et liste de sites en favoris.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *