source: orange/Orange/OrangeWidgets/Classify/OWC45Tree.py @ 9671:a7b056375472

Revision 9671:a7b056375472, 8.1 KB checked in by anze <anze.staric@…>, 2 years ago (diff)

Moved orange to Orange (part 2)

Line 
1"""
2<name>C4.5</name>
3<description>C45 (classification tree) learner/classifier.</description>
4<icon>icons/C45.png</icon>
5<contact>Janez Demsar (janez.demsar(@at@)fri.uni-lj.si)</contact>
6<priority>35</priority>
7"""
8from OWWidget import *
9import OWGUI
10from exceptions import Exception
11
12from orngWrap import PreprocessedLearner
13class OWC45Tree(OWWidget):
14    settingsList = ["name",
15                    "infoGain", "subset", "probThresh",
16                    "minObjs", "prune", "cf",
17                    "iterative", "manualWindow", "window", "manualIncrement", "increment", "trials",
18                    "convertToOrange"]
19
20    def __init__(self, parent=None, signalManager = None, name='C4.5'):
21        OWWidget.__init__(self, parent, signalManager, name, wantMainArea = 0, resizingEnabled = 0)
22
23        self.callbackDeposit = []
24
25        self.inputs = [("Data", ExampleTable, self.setData), ("Preprocess", PreprocessedLearner, self.setPreprocessor)]
26        self.outputs = [("Learner", orange.Learner),("Classification Tree", orange.TreeClassifier)]#, ("C45 Tree", orange.C45Classifier)]
27
28        # Settings
29        self.name = 'C4.5'
30        self.infoGain = 0;  self.subset = 0;       self.probThresh = 0;
31        self.useMinObjs = 1; self.minObjs = 2;   self.prune = 1;       self.cf = 25
32        self.iterative = 0; self.manualWindow = 0; self.window = 50;     self.manualIncrement = 0;  self.increment = 10;   self.trials = 10
33
34        self.convertToOrange = 1
35
36        self.loadSettings()
37
38        self.data = None                    # input data set
39        self.preprocessor = None            # no preprocessing as default
40
41        OWGUI.lineEdit(self.controlArea, self, 'name', box='Learner/Classifier Name',
42                 tooltip='Name to be used by other widgets to identify your learner/classifier.')
43        OWGUI.separator(self.controlArea)
44
45        self.wbSplit = OWGUI.widgetBox(self.controlArea, "Splitting")
46        OWGUI.checkBox(self.wbSplit, self, 'infoGain', 'Use information gain instead of ratio (-g)')
47        OWGUI.checkBox(self.wbSplit, self, 'subset', 'Subsetting (-s)')
48        OWGUI.checkBox(self.wbSplit, self, 'probThresh', 'Probabilistic threshold for continuous attributes (-p)')
49
50        OWGUI.separator(self.controlArea)
51
52        self.wbPruning = OWGUI.widgetBox(self.controlArea, "Pruning")
53        OWGUI.checkWithSpin(self.wbPruning, self, 'Minimal examples in leaves (-m)', 1, 1000, 'useMinObjs', 'minObjs', '', 1, labelWidth = 225)
54        OWGUI.checkWithSpin(self.wbPruning, self, 'Post pruning with confidence level (-cf) of ', 0, 100, 'prune', 'cf', '', 5, labelWidth = 225)
55
56        OWGUI.separator(self.controlArea)
57
58        self.wbIterative = OWGUI.widgetBox(self.controlArea, "Iterative generation")
59        self.cbIterative = OWGUI.checkBox(self.wbIterative, self, 'iterative', 'Generate the tree iteratively (-i, -t, -w)')
60        self.spTrial = OWGUI.spin(self.wbIterative, self, 'trials', 1, 30, 1, '', "       Number of trials (-t)", orientation = "horizontal", labelWidth = 225)
61        self.csWindow = OWGUI.checkWithSpin(self.wbIterative, self, "Manually set initial window size (-w) to ", 10, 1000, 'manualWindow', 'window', '', 10, labelWidth = 225)
62        self.csIncrement = OWGUI.checkWithSpin(self.wbIterative, self, "Manually set window increment (-i) to ", 10, 1000, 'manualIncrement', 'increment', '', 10, labelWidth = 225)
63
64        self.cbIterative.disables = [self.spTrial, self.csWindow, self.csIncrement]
65        self.cbIterative.makeConsistent()
66
67#        OWGUI.separator(self.controlArea)
68
69#        OWGUI.checkBox(self.controlArea, self, 'convertToOrange', 'Convert to orange tree structure', box = 1)
70
71        OWGUI.separator(self.controlArea)
72
73        OWGUI.button(self.controlArea, self, "&Apply", callback = self.setLearner, disabled=0, default=True)
74
75        OWGUI.rubber(self.controlArea)
76        self.setLearner()
77
78
79    def sendReport(self):
80        self.reportSettings("Learning parameters",
81                            [("Attribute quality measure", ["Information gain", "Gain ratio"][self.infoGain]),
82                             ("Subsetting", OWGUI.YesNo[self.subset]),
83                             ("Probabilistic threshold for continuous attributes", OWGUI.YesNo[self.probThresh]),
84                             self.useMinObjs and ("Minimal number of examples in leaves", self.minObjs),
85                             self.prune and ("Post pruning confidence level", self.cf),
86                             ("Iterative generation", OWGUI.YesNo[self.iterative]),
87                             self.iterative and ("Number of trials", self.trials),
88                             self.iterative and self.manualWindow and ("Initial window size manually set to", self.window),
89                             self.iterative and self.manualIncrement and ("Window increment manually set to", self.increment)])
90        self.reportData(self.data)
91
92
93
94    def setData(self,data):
95        self.data = self.isDataWithClass(data, orange.VarTypes.Discrete, checkMissing=True) and data or None
96        self.setLearner()
97       
98    def setPreprocessor(self, pp):
99        self.preprocessor = pp
100        self.setLearner()
101
102
103    def setLearner(self):
104        self.error(0)
105        try:
106            self.learner = orange.C45Learner(gainRatio=not self.infoGain, subset=self.subset, probThresh=self.probThresh,
107                                             minObjs=self.useMinObjs and self.minObjs or 0, prune=self.prune, cf=self.cf/100.,
108                                             batch = not self.iterative, window=self.manualWindow and self.window or 0, increment=self.manualIncrement and self.increment or 0, trials=self.trials,
109                                             convertToOrange = 1, #self.convertToOrange,
110                                             storeExamples = 1)
111        except orange.KernelException, ex:
112            self.error(0, "C45Loader: cannot load \c45.dll")
113            import orngDebugging
114            # Dont show the message box when running debugging scripts
115            if not orngDebugging.orngDebuggingEnabled and getattr(self, "__showMessageBox", True): 
116                # The message string must not have newlines otherwise it
117                # confuses Qt to show it in plain text not as rtf.
118                QMessageBox.warning( None, "C4.5 plug-in", '''File c45.dll not found.
119See <a href="http://orange.biolab.si/doc/reference/Orange.classification.tree/#c4-5-classifier-and-learner">this link</a>
120for the instructions on how to build the library.'''.replace("\n", " "), QMessageBox.Ok)
121                setattr(self, "__showMessageBox", False)
122            return
123       
124        if self.preprocessor:
125            self.learner = self.preprocessor.wrapLearner(self.learner)
126
127        self.learner.name = self.name
128        self.send("Learner", self.learner)
129
130        self.learn()
131
132
133    def learn(self):
134        self.error()
135        if self.data and self.learner:
136            if not self.data.domain.classVar:
137                self.error("This data set has no class.")
138                self.classifier = None
139            elif self.data.domain.classVar.varType != orange.VarTypes.Discrete:
140                self.error("This algorithm only works with discrete classes.")
141                self.classifier = None
142            else:
143                try:
144                    self.classifier = self.learner(self.data)
145                    self.classifier.name = self.name
146                except Exception, (errValue):
147                    self.error(str(errValue))
148                    self.classifier = None
149        else:
150            self.classifier = None
151
152#        self.send("Classifier", self.classifier)
153#        if self.convertToOrange:
154        self.send("Classification Tree", self.classifier)
155#        else:
156#            self.send("C45 Tree", self.classifier)
157
158       
159##############################################################################
160# Test the widget, run from DOS prompt
161# > python OWDataTable.py)
162# Make sure that a sample data set (adult_sample.tab) is in the directory
163
164if __name__=="__main__":
165    a=QApplication(sys.argv)
166    ow=OWC45Tree()
167##    dataset = orange.ExampleTable('adult_sample')
168##    ow.setData(dataset)
169
170    ow.show()
171    a.exec_()
172    ow.saveSettings()
Note: See TracBrowser for help on using the repository browser.