• Opret dig
  • Glemt adgangskode

User account menu

  • Artikler
  • Forside
  • Forum
  • Nyheder
  • Log ind
Hjem
LinuxIN.dk

Snak med

Opret dig!

Af tuxedo | 07.11.2008 17:03

Data mining

Programmering
Jeg skal til at skrive nogle funktioner til data mining og statistik, men hvilket programmeringssprog er egentlig bedst egnet til formålet - Java eller Python?

Jeg har lavet nogle forsøg i begge sprog. Java koden kører generelt hurtigere, men er mere bøvlet at programere i (min erfaring). Python kan jeg godt lide af forskellige årsager og det egner sig godt til formålet, men Java virker mere "professionelt" (min tolkning). F.eks. er funktionerne til dokumentation af koden bedre end i Python.

Der er fordele og lumper ved begge sprog.

Jeg vil gerne have noget at vide om hvilket sprog du ville vælge og hvorfor.

  • Log ind eller opret dig for at tilføje kommentarer

Kommentarer6

# 1

17 år 1 måned siden

Permalink

Indsendt af Kresten Kjaer den 7. november 2008 kl. 20:10

Permalink

java + python

Jython?
http://en.wikipedia.org/wiki/Jython
http://www.jython.org/Project/

Som sagt, der er fordele og ulemper ved begge sprog. De kan begge klare opgaven. Vælg det du er mest flydende i.
  • Log ind eller opret dig for at tilføje kommentarer

# 2

17 år 1 måned siden

Permalink

Indsendt af isaksen den 15. november 2008 kl. 22:28

Permalink

Re: Data mining

Men er de fleste funktioner/regnemetoder ikke lavet i forvejen? Det er selvfølgelig en god øvelse at lave dem selv!
fx http://www.cs.waikato.ac.nz/ml/weka/
eller bare http://sourceforge.net/search/?type_of_search=soft&words=data+mining

  • Log ind eller opret dig for at tilføje kommentarer

# 3

17 år 1 måned siden

Permalink

Indsendt af tuxedo den 22. november 2008 kl. 17:26

Permalink

Svar til #2...
Jo langt de

Svar til #2...

Jo langt de fleste findes allerede et eller andet sted, som f.eks. WEKA, men jeg har nogle jeg selv har udviklet i MATLAB og tænkte at det ville være rart at have adgang til dem i f.eks. Python eller Java da jeg ikke længere har adgang til MATLAB. Jeg har allerede implementeret nogle særlige metoder til genetiske algoritmer, neurale netværk samt klustering. Disse metoder er implementeret i Python fordi jeg godt kan lide sproget og fordi det på mange måder minder mig om MATLAB. Jeg er mest stemt for at fortsætte med at bruge Python,

Jeg ville dog gerne høre om der er noget der taler imod at bruge Python til data mining. Her tænker jeg især på faktorer som performance og skalerbarhed.
  • Log ind eller opret dig for at tilføje kommentarer

# 4

17 år 1 måned siden

Permalink

Indsendt af isaksen den 22. november 2008 kl. 23:32

Permalink

flamebait

Du lyder som en jeg snakkede med for 2 år siden på JAOO!

Men hvis jeg var dig ville jeg lave en poc i python, og hvis du når til at have god "performance" ville jeg skrive en lille del i c/c++.

skalerbarhed? horisontal eller vertikal?
personligt ville jeg vælge Java og noget rmi halløj hvis jeg ville lave noget der lavede vertikal skalering.
ellers hvis det er horisonttal: python med måske c/c++.

Der findes rmi til python http://pyro.sourceforge.net/ pyro! Jeg har dog ikke rørt det! men mit argument falder til jorden

men hvis du er bange for at dit python ikke yder godt, har du så set http://psyco.sourceforge.net/
  • Log ind eller opret dig for at tilføje kommentarer

# 5

17 år 1 måned siden

Permalink

Indsendt af tuxedo den 23. november 2008 kl. 19:58

Permalink

Numpy + SciPy

Jeg har (for sjov) kørt et forsøg med at benytte de fremragende biblioteker NumPy og SciPy til Python. Det er biblioteker hovedsageligt til numeriske beregninger.

Jeg kørte en klustering algoritme på et stort datasæt i hhv. ren Python, Python med Numpy + SciPy, og Java. NumPy + SciPy metoden var klart hurtigst!

#4:
Mht. skalerbarhed så tænkte jeg mest på horisontal skalerbarhed. Jeg er begyndt at genopfriske mine C kundskaber. Jeg har nu mest tænkt mig at fortsætte med at udvikle i Python og så optimere hen ad vejen i C hvis det bliver nødvendigt.

Måske jeg ikke er helt på afveje?

Tak for linket til Psyco!
  • Log ind eller opret dig for at tilføje kommentarer

# 6

17 år 1 måned siden

Permalink

Indsendt af tkjacobsen den 25. november 2008 kl. 08:31

In reply to Numpy + SciPy by tuxedo

Permalink

Re: Numpy + SciPy

Jeg har samme erfaring. Skriv det meste af koden i numpy+scipy. Kør det gennem en profiler. Optimer de svage punkter i C/Fortran..

Så set fra min side er du bestemt ikke på afveje. (medmindre jeg også er det)
  • Log ind eller opret dig for at tilføje kommentarer

Svar søges

Linux Foundation brugte 8,4 millioner dollars på Linux Kernel projektet i 2025 0
KDE overgår indsamlingsmålet for 2025 med rekordstor støtte fra lokalsamfundet 0
Zypper Package Manager brugervejledning til openSUSE brugere og deres derivater 0
KDE Spectacle tilføjer OCR understøttelse for at kopiere tekst direkte fra skærmbilleder 0
Deaktiverer alle AI-funktioner i Firefox Web Browser 0

Seneste aktivitet

Nu kan man skrive private beskeder 3
Glædelig Jul 3
Kunstig inteligens 4
Kopiering til min Samsung telefon 5
Mbox mail import til Thunderbird 14
FOSS i Færdselsstyrelsen 2
Program ala Dreamweaver 2
Test af forum 5
Flatpak og hvorfor 1
Har brugt GLF OS, en NixOS-baseret distribution lavet i Frankrig. 2
Crontab 2
[ LØST ] Flere genveje på Firefox skrivebordet 5
Linuxin er nu migreret til Drupal 11 15
Dansk distro til software udviklere 3
Driver til min scanner? 3
Affinity V3 2
copy hvordan 1
Sortering af filer - sort of... 4
Det der ikke må galt gik galt 5
VPN — 8 tests, 1 klar vinder i 2025 3

© 2025 Linuxin og de respektive skribenter

Oprettet og drevet af nørder siden 2004 !