Angewandte Computational Economics: Identifizierung von "User Innovation" durch Maschinelles Lernen
Ein großer Teil der empirischen Forschung hat gezeigt, dass so genannte "lead user" und nicht Hersteller, die Quelle vieler funktional-neuartiger Produkte und Dienstleistungen sind. Während das Lead-User-Phänomen wegen der schieren Größe seiner Bedeutung von großem Forschungsinteresse zu sein scheint, steht es im Widerspruch zum dominanten Paradigma, wo öffentliche Förder- und Innovationssysteme nur für Innovationen des Herstellers verantwortlich sind. Die heutige Menge an Open-Source-Daten kann uns helfen, diese Lücke zu schließen.
Ziel dieses Projektes ist es daher, neuartige Such- und Maschinell-Lernalgorithmen anzuwenden, um einen automatisierten Ansatz zu entwickeln, um Lead-User und die Erfindungen, die sie in großen Körpern von unstrukturierten Datensätzen machen, zu identifizieren. Unser Hauptziel liegt daher in der Klassifizierung von Informationen. Wir wollen bestehende Sätze (geschriebene Projektbeschreibungen, gesprochener Text in Videos) von Projekten aus der Kickstarter-Plattform nutzen, die größte Plattform zur Finanzierung von Innovationen durch die Menschenmenge. Hier finden wir eine Vielzahl von Methoden, um das Konzept der Lead-User-basierten und erfolgreichen Crowdfunding-Projekte zum Zeitpunkt des Projektstarts zu erlernen. Genauer gesagt wenden wir Wortvektormodelle, Stimmungsanalysen, bestrahlte logistische Regressionen und beaufsichtigte maschinelle Lernansätze (Unterstützungsvektormaschinen) an. Unsere Arbeit basiert auf einem Open-Source-Software-Stack von Python-Bibliotheken, StanfordCoreNLP, R Software, IBM Watson und TensorFlow, Googles Open Source Machine Learning Library.
Durch die Anwendung der erwähnten Methoden (1) identifizieren wir Lead-User und ordnen die entsprechenden Phrasen zu, die die Lead-User-Merkmale zuerst markieren. (2) Anschließend müssten wir den Lernalgorithmus mit den bereitgestellten Informationen ausbilden. (3) Die Erkenntnisse können dann mit zusätzlichen Daten, die von der Kickstarter-Website erhoben werden, bekräftigt werden, beispielsweise durch Umwandlung von gesprochenem Text aus Videos. Nach der Feinabstimmung des Algorithmus würden wir dann die dritte Phase nutzen, um dem Algorithmus andere ähnliche Unternehmerprojekte aus der Liste von 210.000 Projekten in der Datenbank zu finden. Schließlich analysieren wir die zurückgegebene Liste der möglichen Lead-User-Projekte hinsichtlich ihrer Leistung (Erfolg und zugesicherter Betrag). Nach unserem besten Wissen sind alle drei erwähnten Ansätze eine Neuheit in der Crowdfunding- und Lead User-forschung.