source: orange/orange/OrangeWidgets/Classify/OWC45Tree.py @ 8956:0abe1bb4e3ee

Revision 8956:0abe1bb4e3ee, 7.8 KB checked in by mitar, 3 years ago (diff)

Use new Orange website URL.

Line 
1"""
2<name>C4.5</name>
3<description>C45 (classification tree) learner/classifier.</description>
4<icon>icons/C45.png</icon>
5<contact>Janez Demsar (janez.demsar(@at@)fri.uni-lj.si)</contact>
6<priority>35</priority>
7"""
8from OWWidget import *
9import OWGUI
10from exceptions import Exception
11
12from orngWrap import PreprocessedLearner
13class OWC45Tree(OWWidget):
14    settingsList = ["name",
15                    "infoGain", "subset", "probThresh",
16                    "minObjs", "prune", "cf",
17                    "iterative", "manualWindow", "window", "manualIncrement", "increment", "trials",
18                    "convertToOrange"]
19
20    def __init__(self, parent=None, signalManager = None, name='C4.5'):
21        OWWidget.__init__(self, parent, signalManager, name, wantMainArea = 0, resizingEnabled = 0)
22
23        self.callbackDeposit = []
24
25        self.inputs = [("Examples", ExampleTable, self.setData), ("Preprocess", PreprocessedLearner, self.setPreprocessor)]
26        self.outputs = [("Learner", orange.Learner),("Classification Tree", orange.TreeClassifier)]#, ("C45 Tree", orange.C45Classifier)]
27
28        # Settings
29        self.name = 'C4.5'
30        self.infoGain = 0;  self.subset = 0;       self.probThresh = 0;
31        self.useMinObjs = 1; self.minObjs = 2;   self.prune = 1;       self.cf = 25
32        self.iterative = 0; self.manualWindow = 0; self.window = 50;     self.manualIncrement = 0;  self.increment = 10;   self.trials = 10
33
34        self.convertToOrange = 1
35
36        self.loadSettings()
37
38        self.data = None                    # input data set
39        self.preprocessor = None            # no preprocessing as default
40
41        OWGUI.lineEdit(self.controlArea, self, 'name', box='Learner/Classifier Name',
42                 tooltip='Name to be used by other widgets to identify your learner/classifier.')
43        OWGUI.separator(self.controlArea)
44
45        self.wbSplit = OWGUI.widgetBox(self.controlArea, "Splitting")
46        OWGUI.checkBox(self.wbSplit, self, 'infoGain', 'Use information gain instead of ratio (-g)')
47        OWGUI.checkBox(self.wbSplit, self, 'subset', 'Subsetting (-s)')
48        OWGUI.checkBox(self.wbSplit, self, 'probThresh', 'Probabilistic threshold for continuous attributes (-p)')
49
50        OWGUI.separator(self.controlArea)
51
52        self.wbPruning = OWGUI.widgetBox(self.controlArea, "Pruning")
53        OWGUI.checkWithSpin(self.wbPruning, self, 'Minimal examples in leaves (-m)', 1, 1000, 'useMinObjs', 'minObjs', '', 1, labelWidth = 225)
54        OWGUI.checkWithSpin(self.wbPruning, self, 'Post pruning with confidence level (-cf) of ', 0, 100, 'prune', 'cf', '', 5, labelWidth = 225)
55
56        OWGUI.separator(self.controlArea)
57
58        self.wbIterative = OWGUI.widgetBox(self.controlArea, "Iterative generation")
59        self.cbIterative = OWGUI.checkBox(self.wbIterative, self, 'iterative', 'Generate the tree iteratively (-i, -t, -w)')
60        self.spTrial = OWGUI.spin(self.wbIterative, self, 'trials', 1, 30, 1, '', "       Number of trials (-t)", orientation = "horizontal", labelWidth = 225)
61        self.csWindow = OWGUI.checkWithSpin(self.wbIterative, self, "Manually set initial window size (-w) to ", 10, 1000, 'manualWindow', 'window', '', 10, labelWidth = 225)
62        self.csIncrement = OWGUI.checkWithSpin(self.wbIterative, self, "Manually set window increment (-i) to ", 10, 1000, 'manualIncrement', 'increment', '', 10, labelWidth = 225)
63
64        self.cbIterative.disables = [self.spTrial, self.csWindow, self.csIncrement]
65        self.cbIterative.makeConsistent()
66
67#        OWGUI.separator(self.controlArea)
68
69#        OWGUI.checkBox(self.controlArea, self, 'convertToOrange', 'Convert to orange tree structure', box = 1)
70
71        OWGUI.separator(self.controlArea)
72
73        OWGUI.button(self.controlArea, self, "&Apply", callback = self.setLearner, disabled=0, default=True)
74
75        OWGUI.rubber(self.controlArea)
76        self.setLearner()
77
78
79    def sendReport(self):
80        self.reportSettings("Learning parameters",
81                            [("Attribute quality measure", ["Information gain", "Gain ratio"][self.infoGain]),
82                             ("Subsetting", OWGUI.YesNo[self.subset]),
83                             ("Probabilistic threshold for continuous attributes", OWGUI.YesNo[self.probThresh]),
84                             self.useMinObjs and ("Minimal number of examples in leaves", self.minObjs),
85                             self.prune and ("Post pruning confidence level", self.cf),
86                             ("Iterative generation", OWGUI.YesNo[self.iterative]),
87                             self.iterative and ("Number of trials", self.trials),
88                             self.iterative and self.manualWindow and ("Initial window size manually set to", self.window),
89                             self.iterative and self.manualIncrement and ("Window increment manually set to", self.increment)])
90        self.reportData(self.data)
91
92
93
94    def setData(self,data):
95        self.data = self.isDataWithClass(data, orange.VarTypes.Discrete, checkMissing=True) and data or None
96        self.setLearner()
97       
98    def setPreprocessor(self, pp):
99        self.preprocessor = pp
100        self.setLearner()
101
102
103    def setLearner(self):
104        self.error(0)
105        try:
106            self.learner = orange.C45Learner(gainRatio=not self.infoGain, subset=self.subset, probThresh=self.probThresh,
107                                             minObjs=self.useMinObjs and self.minObjs or 0, prune=self.prune, cf=self.cf/100.,
108                                             batch = not self.iterative, window=self.manualWindow and self.window or 0, increment=self.manualIncrement and self.increment or 0, trials=self.trials,
109                                             convertToOrange = 1, #self.convertToOrange,
110                                             storeExamples = 1)
111        except orange.KernelException, ex:
112            self.error(0, "C45Loader: cannot load \c45.dll")
113            import orngDebugging
114            if not orngDebugging.orngDebuggingEnabled and getattr(self, "__showMessageBox", True):  # Dont show the message box when running debugging scripts
115                QMessageBox.warning( None, "C4.5 plug-in", 'File c45.dll not found. See http://orange.biolab.si/doc/reference/C45Learner.htm', QMessageBox.Ok)
116                setattr(self, "__showMessageBox", False)
117            return
118       
119        if self.preprocessor:
120            self.learner = self.preprocessor.wrapLearner(self.learner)
121
122        self.learner.name = self.name
123        self.send("Learner", self.learner)
124
125        self.learn()
126
127
128    def learn(self):
129        self.error()
130        if self.data and self.learner:
131            if not self.data.domain.classVar:
132                self.error("This data set has no class.")
133                self.classifier = None
134            elif self.data.domain.classVar.varType != orange.VarTypes.Discrete:
135                self.error("This algorithm only works with discrete classes.")
136                self.classifier = None
137            else:
138                try:
139                    self.classifier = self.learner(self.data)
140                    self.classifier.name = self.name
141                except Exception, (errValue):
142                    self.error(str(errValue))
143                    self.classifier = None
144        else:
145            self.classifier = None
146
147#        self.send("Classifier", self.classifier)
148#        if self.convertToOrange:
149        self.send("Classification Tree", self.classifier)
150#        else:
151#            self.send("C45 Tree", self.classifier)
152
153       
154##############################################################################
155# Test the widget, run from DOS prompt
156# > python OWDataTable.py)
157# Make sure that a sample data set (adult_sample.tab) is in the directory
158
159if __name__=="__main__":
160    a=QApplication(sys.argv)
161    ow=OWC45Tree()
162##    dataset = orange.ExampleTable('adult_sample')
163##    ow.setData(dataset)
164
165    ow.show()
166    a.exec_()
167    ow.saveSettings()
Note: See TracBrowser for help on using the repository browser.