source: orange/Orange/OrangeWidgets/Classify/OWClassificationTree.py @ 11216:93e23bd7ec3e

Revision 11216:93e23bd7ec3e, 7.9 KB checked in by Ales Erjavec <ales.erjavec@…>, 17 months ago (diff)

Merged from upstream (biolab/orange).

Line 
1"""
2<name>Classification Tree</name>
3<description>Classification tree learner/classifier.</description>
4<icon>icons/ClassificationTree.svg</icon>
5<contact>Janez Demsar (janez.demsar(@at@)fri.uni-lj.si)</contact>
6<priority>30</priority>
7"""
8from OWWidget import *
9import orngTree, OWGUI
10from orngWrap import PreprocessedLearner
11from exceptions import Exception
12
13import Orange
14
15import warnings
16warnings.filterwarnings("ignore", ".*this class is not optimized for 'candidates' list and can be very slow.*", orange.KernelWarning, ".*orngTree", 34)
17
18
19
20class OWClassificationTree(OWWidget):
21    settingsList = ["name",
22                    "estim", "relK", "relM",
23                    "bin", "subset",
24                    "preLeafInst", "preNodeInst", "preNodeMaj",
25                    "preLeafInstP", "preNodeInstP", "preNodeMajP",
26                    "postMaj", "postMPruning", "postM",
27                    "limitDepth", "maxDepth"]
28
29    measures = (("Information Gain", "infoGain"), ("Gain Ratio", "gainRatio"), ("Gini Index", "gini"), ("ReliefF", "relief"))
30    binarizationOpts = ["No binarization", "Exhaustive search for optimal split", "One value against others"]
31
32    def __init__(self, parent=None, signalManager=None, name='Classification Tree'):
33        OWWidget.__init__(self, parent, signalManager, name, wantMainArea=0, resizingEnabled=0)
34
35        self.inputs = [("Data", ExampleTable, self.setData),
36                       ("Preprocess", PreprocessedLearner, self.setPreprocessor)]
37
38        self.outputs = [("Learner", Orange.classification.tree.TreeLearner),
39                        ("Classification Tree", Orange.classification.tree.TreeClassifier), ]
40
41        self.name = 'Classification Tree'
42        self.estim = 0; self.relK = 5; self.relM = 100; self.limitRef = True
43        self.bin = 0; self.subset = 0
44        self.preLeafInstP = 2; self.preNodeInstP = 5; self.preNodeMajP = 95
45        self.preLeafInst = 1; self.preNodeInst = 0; self.preNodeMaj = 0
46        self.postMaj = 1; self.postMPruning = 1; self.postM = 2.0
47        self.limitDepth = False; self.maxDepth = 100
48        self.loadSettings()
49
50        self.data = None
51        self.preprocessor = None
52        self.setLearner()
53
54        OWGUI.lineEdit(self.controlArea, self, 'name', box='Learner/Classifier Name', tooltip='Name to be used by other widgets to identify your learner/classifier.')
55        OWGUI.separator(self.controlArea)
56
57        qBox = OWGUI.widgetBox(self.controlArea, 'Attribute selection criterion')
58
59        self.qMea = OWGUI.comboBox(qBox, self, "estim", items=[m[0] for m in self.measures], callback=self.measureChanged)
60
61        b1 = OWGUI.widgetBox(qBox, orientation="horizontal")
62        OWGUI.separator(b1, 16, 0)
63        b2 = OWGUI.widgetBox(b1)
64        self.cbLimitRef, self.hbxRel1 = OWGUI.checkWithSpin(b2, self, "Limit the number of reference examples to ", 1, 1000, "limitRef", "relM")
65        OWGUI.separator(b2)
66        self.hbxRel2 = OWGUI.spin(b2, self, "relK", 1, 50, orientation="horizontal", label="Number of neighbours in ReliefF  ")
67
68        OWGUI.separator(self.controlArea)
69
70        OWGUI.radioButtonsInBox(self.controlArea, self, 'bin', self.binarizationOpts, "Binarization")
71        OWGUI.separator(self.controlArea)
72
73        self.measureChanged()
74
75        self.pBox = OWGUI.widgetBox(self.controlArea, 'Pre-Pruning')
76
77        self.preLeafInstBox, self.preLeafInstPBox = OWGUI.checkWithSpin(self.pBox, self, "Min. instances in leaves ", 1, 1000, "preLeafInst", "preLeafInstP")
78        self.preNodeInstBox, self.preNodeInstPBox = OWGUI.checkWithSpin(self.pBox, self, "Stop splitting nodes with less instances than ", 1, 1000, "preNodeInst", "preNodeInstP")
79        self.preNodeMajBox, self.preNodeMajPBox = OWGUI.checkWithSpin(self.pBox, self, "Stop splitting nodes with a majority class of (%)", 1, 100, "preNodeMaj", "preNodeMajP")
80        self.cbLimitDepth, self.maxDepthBox = OWGUI.checkWithSpin(self.pBox, self, "Stop splitting nodes at depth", 0, 1000, "limitDepth", "maxDepth")
81        OWGUI.separator(self.controlArea)
82        self.mBox = OWGUI.widgetBox(self.controlArea, 'Post-Pruning')
83
84        OWGUI.checkBox(self.mBox, self, 'postMaj', 'Recursively merge leaves with same majority class')
85        self.postMPruningBox, self.postMPruningPBox = OWGUI.checkWithSpin(self.mBox, self, "Pruning with m-estimate, m=", 0, 1000, 'postMPruning', 'postM')
86
87        OWGUI.separator(self.controlArea)
88        self.btnApply = OWGUI.button(self.controlArea, self, "&Apply", callback=self.setLearner, disabled=0, default=True)
89
90        OWGUI.rubber(self.controlArea)
91        self.resize(200, 200)
92
93
94    def sendReport(self):
95        self.reportSettings("Learning parameters",
96                            [("Attribute selection", self.measures[self.estim][0]),
97                             self.estim == 3 and ("ReliefF settings", "%i reference examples, %i neighbours" % (self.relM, self.relK)),
98                             ("Binarization", self.binarizationOpts[self.bin]),
99                             ("Pruning", ", ".join(s for s, c in (
100                                                 ("%i instances in leaves" % self.preLeafInstP, self.preLeafInst),
101                                                 ("%i instance in node" % self.preNodeInstP, self.preNodeInst),
102                                                 ("stop on %i%% purity" % self.preNodeMajP, self.preNodeMaj),
103                                                 ("maximum depth %i" % self.maxDepth, self.limitDepth)) if c)
104                                          or "None"),
105                             ("Recursively merge leaves with same majority class", OWGUI.YesNo[self.postMaj]),
106                             ("Pruning with m-estimate", ["No", "m=%i" % self.postM][self.postMPruning])])
107        self.reportData(self.data)
108
109    def setPreprocessor(self, preprocessor):
110        self.preprocessor = preprocessor
111        self.setLearner()
112
113    def setLearner(self):
114        if hasattr(self, "btnApply"):
115            self.btnApply.setFocus()
116        if not self.limitDepth:
117            mDepth = {}
118        else:
119            mDepth = {'maxDepth': self.maxDepth}
120        self.learner = orngTree.TreeLearner(measure=self.measures[self.estim][1],
121            reliefK=self.relK, reliefM=self.limitRef and self.relM or -1,
122            binarization=self.bin,
123            minExamples=self.preNodeInst and self.preNodeInstP,
124            minSubset=self.preLeafInst and self.preLeafInstP,
125            maxMajority=self.preNodeMaj and self.preNodeMajP / 100.0 or 1.0,
126            sameMajorityPruning=self.postMaj,
127            mForPruning=self.postMPruning and self.postM,
128            storeExamples=1, **mDepth)
129
130        self.learner.name = self.name
131        if self.preprocessor:
132            self.learner = self.preprocessor.wrapLearner(self.learner)
133
134        self.send("Learner", self.learner)
135
136        self.error()
137        if self.data:
138            try:
139                self.classifier = self.learner(self.data)
140                self.classifier.name = self.name
141            except Exception, (errValue):
142                self.error(str(errValue))
143                self.classifier = None
144        else:
145            self.classifier = None
146
147        self.send("Classification Tree", self.classifier)
148
149    def measureChanged(self):
150        relief = self.estim == 3
151        self.hbxRel1.setEnabled(relief and self.limitRef)
152        self.hbxRel2.setEnabled(relief)
153        self.cbLimitRef.setEnabled(relief)
154
155    def setData(self, data):
156        self.data = self.isDataWithClass(data, orange.VarTypes.Discrete, checkMissing=True) and data or None
157        self.setLearner()
158
159
160##############################################################################
161# Test the widget, run from DOS prompt
162# > python OWDataTable.py)
163# Make sure that a sample data set (adult_sample.tab) is in the directory
164
165if __name__ == "__main__":
166    a = QApplication(sys.argv)
167    ow = OWClassificationTree()
168
169    #d = orange.ExampleTable('adult_sample')
170    #ow.setData(d)
171
172    ow.show()
173    a.exec_()
174    ow.saveSettings()
Note: See TracBrowser for help on using the repository browser.