Bob Muglia, vétéran de Microsoft : les graphes de connaissances relationnelles vont transformer l'entreprise |  ZDNet

Selon Bob Muglia, vingt ans de travail sur l’innovation des bases de données apporteront le calcul relationnel d’EF Codd aux graphes de connaissances, ce qu’il appelle les « graphes de connaissances relationnelles », pour révolutionner l’analyse métier.

IA relationnelle

Bob Muglia est en quelque sorte un barde des bases de données, capable de dérouler de vastes histoires sur l’évolution de la technologie.

C’est ce qu’a fait Muglia, ancien dirigeant de Microsoft et ancien PDG de Snowflake, mercredi matin lors de son discours d’ouverture à la conférence Knowledge Graph à New York.

Le sujet de sa conférence, “De la pile de données moderne aux graphes de connaissances”, a réuni environ cinquante ans de technologie de base de données sous une nouvelle forme.

L’histoire de base est la suivante : cinq entreprises ont créé des plates-formes d’analyse de données modernes, Snowflake, Amazon, Databricks, Google et Azure, mais ces plates-formes d’analyse de données ne peuvent pas effectuer d’analyse commerciale, y compris, surtout, représenter les règles qui sous-tendent la conformité et gouvernance.

“L’industrie sait que c’est un problème”, a déclaré Muglia. Les cinq plates-formes, a-t-il dit, représentant “la pile de données moderne, ont permis de créer une” nouvelle génération de ces applications de données très, très importantes. “Cependant,” lorsque nous regardons la pile de données moderne, et nous regardons ce que nous pouvons faire efficacement et ce que nous ne pouvons pas faire efficacement, je dirais que le problème numéro un que les clients rencontrent avec ces cinq plateformes est la gouvernance.”

Aussi: Metcalfe, créateur d’Ethernet : Web3 aura toutes sortes d'”effets de réseau”

Muglia, qui a dirigé l’activité SQL Server chez Microsoft, entre autres exploits au cours d’une carrière de 30 ans dans la création de bases de données, a donné des illustrations de règles métier que les plates-formes de données ne peuvent pas modéliser.

“Donc, si vous vouliez effectuer une requête pour dire:” Hé, dites-moi toutes les ressources auxquelles Fred Jones a accès dans cette organisation “- c’est une requête difficile à écrire”, a-t-il déclaré. “En fait, c’est une requête qui ne peut probablement pas s’exécuter efficacement sur une base de données SQL moderne si l’organisation est très grande et complexe.”

Le problème, a déclaré Muglia, était que les algorithmes basés sur un langage de requête structuré, ou SQL, ne peuvent pas effectuer des requêtes “récursives” aussi complexes.

bob-muglia-4-mai-2022-kgc-keynote.png

En tant que barde de la technologie des bases de données, Muglia transmet souvent des détails techniques avec des fioritures rhétoriques : Binary Join ! Join binaire ! Join binaire !

La conférence Knowledge Graph 2022

“Il y a eu de nombreuses générations d’algorithmes construits qui ont tous été créés autour de l’idée d’un binaire”, a déclaré Muglia. “Ils ont deux tables avec la clé pour joindre les deux ensemble, puis vous obtenez un ensemble de résultats, et l’optimiseur de requête prend et optimise l’ordre de ces jointures – jointure binaire, jointure binaire, jointure binaire!”

Les problèmes récursifs tels que les autorisations de Fred Jones, a-t-il dit, “ne peuvent pas être résolus efficacement avec ces algorithmes, point final”.

La bonne structure pour les relations commerciales, par opposition aux relations de données, a déclaré Muglia, est un graphe de connaissances.

“Qu’est-ce qu’un graphe de connaissances ?” demanda Muglia, rhétoriquement. Il a proposé sa propre définition de ce qui peut être un concept parfois mystérieux. “Un graphe de connaissances est une base de données qui modélise les concepts métier, les relations entre eux et les règles et contraintes métier associées.”

Muglia, maintenant membre du conseil d’administration de la start-up Relational AI, a déclaré au public que l’avenir des applications métier sera des graphes de connaissances construits sur l’analyse de données, mais avec la torsion qu’ils utiliseront le calcul relationnel remontant jusqu’à la base de données relationnelle. pionnier EF Codd.

“Retournez au début”, a exhorté Muglia. “Quelle est la capacité algorithmique fondamentale de la technologie relationnelle, que peut-on en faire ?”

muglia-de-la-pile-de-donnees-moderne-aux-graphiques-de-connaissance-5-1-22-slide-9.jpg

Il existe cinq plates-formes d’analyse basées sur SQL, a noté Muglia, mais aucune d’entre elles ne peut effectuer à elle seule une analyse commerciale, contrairement à l’analyse de données.

IA relationnelle

“Si nous regardons ce que Codd créait dans les années 1970, le théorème disait que l’algèbre relationnelle et les requêtes relationnelles sont exactement équivalentes en puissance d’expression – tellement intéressant ! J’ai toujours su que c’était intéressant, et maintenant je sais pourquoi.”

En utilisant la technologie de l’IA relationnelle, en particulier la technologie développée par le fondateur et PDG Molham Aref pour l’optimisation des requêtes, a déclaré Muglia, combinée aux graphes de connaissances, il est possible d’apporter la même algèbre relationnelle à l’organisation des concepts commerciaux.

“Si nous sommes passés aux graphes de connaissances relationnelles, nous passons maintenant aux principes fondamentaux du calcul relationnel, et nous émettons des instructions de calcul relationnel qui ne sont pas ordonnées et qui contiennent des règles et des contraintes métier.”

muglia-de-la-pile-de-donnees-moderne-aux-graphiques-de-connaissance-5-1-22-slide-15.jpg

SQL ne va pas disparaître, mais il ne peut pas vraiment gérer les requêtes de l’analyse commerciale, a déclaré Muglia.

IA relationnelle

Le travail visant à “redéfinir fondamentalement la façon dont nous pouvons utiliser l’algèbre relationnelle”, a déclaré Muglia, dure depuis environ 20 ans, mais a pris de l’ampleur en 2010 avec les travaux de l’Aref, et au sein de nombreuses universités et entreprises, avec des centaines d’articles publiés sur le sujet, dit-il.

“Cela a été un effort de coopération incroyable entre les communautés de recherche à travers le monde”, a-t-il déclaré. “Materialize l’utilise de manière fondamentale à l’intérieur de la matérialisation qu’ils effectuent. LinkedIn a adopté une partie de cela via une base de données de graphes qu’ils utilisent appelée Liquid.”

Le graphe de connaissances relationnelles introduit un nouveau langage, appelé Rel, bien que “SQL reste important”, a déclaré Muglia, “SQL ne va pas disparaître”, car il sert en quelque sorte de rampe d’accès au nouveau monde du graphe de connaissances relationnelles. .

“Je peux même affirmer que les meilleurs jours de SQL sont devant lui.”

Muglia prévoit “un potentiel incroyable et incroyable du point de vue du développement logiciel, et toutes sortes de choses en découlent”, a-t-il déclaré à propos du graphe de connaissances relationnelles. “Au fur et à mesure que la technologie mûrit – et je veux me concentrer sur le fait qu’elle n’est pas encore mûre – mais à mesure que la technologie mûrit, nous allons voir des choses que nous pouvons faire avec dont nous ne pouvions même pas rêver.”

Cela inclut une utilisation beaucoup plus importante de l’apprentissage automatique dans l’analyse commerciale, comme l’indique le nom d’IA relationnelle. En outre, le modèle commercial, a déclaré Muglia, ne sera plus “juste quelque chose que nous mettons sur un tableau blanc qu’un ingénieur doit examiner pour écrire du code Java”.

“Le modèle”, a déclaré Muglia, “devient le programme, et les analystes commerciaux peuvent donc s’impliquer et apporter des modifications aux structures de données”.

“Pensez aux milliers de personnes impliquées qui connaissent l’entreprise – pensez-y!”

À l’heure actuelle, la technologie de l’IA relationnelle est “un gant assez blanc”, a-t-il déclaré. “Nous avons un certain nombre d’organisations avec lesquelles nous effectuons des essais limités”, et la société espère “l’ouvrir en libre-service” l’année prochaine avec “une large version bêta pour les développeurs afin que les gens puissent s’inscrire et commencer à utiliser le système. ” C’est la même trajectoire, a-t-il dit, que lorsqu’il exécutait Snowflake en 2014 et qu’il a publié les premières versions de son code.

“Nous sommes au début d’une toute nouvelle ère”, a déclaré Muglia. “C’est comme la pile de données moderne en 2013, 2014 – c’est là où nous en sommes dans ce cycle de vie.

“Et tout comme la pile de données moderne a révolutionné l’analyse, je suis complètement convaincu que les graphes de connaissances, et, en particulier, les graphes de connaissances relationnelles, vont transformer la façon dont les entreprises fonctionnent.”

La conférence Knowledge Graph en est à sa quatrième année, après avoir commencé sa vie comme une petite affaire dans une salle de bal de l’Université de Columbia en 2019. Cette année, après deux ans de débats exclusivement virtuels, la conférence s’est transformée en un événement hybride tentaculaire, avec des dizaines de panels ainsi que des sessions en direct sur le campus Cornell Tech sur Roosevelt Island à New York. Le programme se déroule jusqu’au 6 mai .