We are consulting about Open source Statistic program.

If you want to use or analyze statistic ,Data Mining and Statistic process control (cp cpk). You know you can use OpenStat ,R programing ,Rattle or Weka ... Wow its freely. You may not familiar with these So I'll be a consulting or trainer for using these program..


E-mail : amto15@hotmail.com
Mobile: +66 97766-306

วันอาทิตย์ที่ 18 เมษายน พ.ศ. 2553

รับเขียน โปรแกรม R และที่ปรึกษาทางการวิจัย


สำหรับผู้ที่สนใจเรียนรู้วิธีการวิเคราะห์ข้อมูล รวมทั้งผู้ที่หลงใหลในพลังความสามารถของโปรแกรม R เป็นการส่วนตัว ถ้าอยากจะศึกษาโปรแกรม R ให้ลึกซึ้ง

ติดต่อ คุณเต้ 089-7766306 email: amto15@hotmail.com

รับสอน รับงานวิเคราะห์ข้อมูล เน้นด้านสถิติ และ data mining เช่น

• Business statistics
• Data mining (applying statistics and pattern recognition to discover knowledge from data)
• Demography
• Econometrics
• Engineering statistics Reliability engineering
• Geostatistics
• Operations research (or Operational Research)
• Social statistics
• Statistical finance,
• Statistical classification
• Statistical surveys
• Structured data analysis (statistics)
• Survival analysis
• Statistics in various sports, particularly baseball and cricket
Statistics form a key basis tool in business and manufacturing as well. It is used to understand measurement systems variability, control processes (as in statistical process control or SPC), for summarizing data, and to make data-driven decisions. In these roles, it is a key tool, and perhaps the only reliable tool.

อ้างอิง http://en.wikipedia.org/wiki/Statistics

สนใจติดต่อ คุณเต้ 089-7766306 email: amto15@hotmail.com




วันเสาร์ที่ 17 เมษายน พ.ศ. 2553

หลักสูตร วิเคราะห์ข้อมูลยุคใหม่ใช้ R Commander

ดูตัวอย่างการใช้ R cmdr ได้ที่ไฟล์ VDO ด้านล่างครับ

สนใจติดต่อได้ที่ 089-7766306,amto15@hotmail.com

ภาพรวมของหลักสูตร

ในปัจจุบันสถาบันการศึกษาและองค์กรต่างๆ ทั้งภาครัฐและเอกชนมีการส่งเสริมการทำวิจัยกันมากขึ้น ทั้งในด้านการวิเคราะห์สถิติ วิจัยตลาด วิจัยด้านการแพทย์ การควบคุมคุณภาพการผลิต รวมทั้งการวิจัยเพื่อเพิ่มประสิทธิภาพการทำงานของหน่วยงานต่างๆ ทำให้ซอฟท์แวร์ด้านการวิเคราะห์ข้อมูลถูกใช้กันอย่างแพร่หลาย โดยโปรแกรมที่ได้รับความนิยมมากที่สุดในประเทศไทย คือ SPSS ส่วนโปรแกรม SAS, Stata , S-Plus, หรือ Statistica ก็มีผู้ใช้อยู่พอสมควร แต่ในประเทศชั้นนำของโลกกลับพบว่ามีแนวโน้มการใช้ Open source software เช่น R มากกว่า เพราะความสามารถในการวิเคราะห์และแสดงผลด้วยกราฟฟิกที่สวยงามมีความทันสมัย ประกอบกับการจัดหาโปรแกรมเชิงพาณิชย์นั้นมีค่าใช้จ่ายที่สูงมาก เป็นอุปสรรคในการสร้างงานวิจัยและไม่เหมาะกับการใช้งานในสถานศึกษาหรือ องค์กรที่มีข้อจำกัดด้านงบประมาณ ซึ่งอาจนำไปสู่การใช้โปรแกรมที่ละเมิดลิขสิทธิ์จนถึงขั้นถูกฟ้องร้องได้
โดยทางออกของปัญหาดังกล่าว คือ การใช้โปรแกรม Open source ที่ผู้ใช้ไม่จำเป็นต้องซื้อลิขสิทธิ์ ซึ่งโปรแกรมที่ได้รับความนิยมมากนั้น คือ โปรแกรม R ในแพ็คเกจของ R Commander จากแต่เดิมหลายคนจะบ่นว่าโปรแกรม R นั้นยากในการเรียนรู้เพราะเป็น command-line แต่โปรแกรม R Commander นี้มีรูปแบบที่ เป็นชุดเมนูคำสั่งสำเร็จรูปแบบ GUI ไม่ต้องเขียน script สั่งงาน (โปรแกรมจะ process ชุดคำสั่งแบบต้นฉบับ R ให้ดูด้วย) ประกอบกับมี Plug-in การใช้งานขั้นสูงให้ด้วย ดังนั้นผู้ใช้ทั่วไปจึงสร้างความคุ้นเคยได้ไม่ยาก สามารถดึงข้อมูลจาก text file (CSV), SPSS, Minitab, Stata, Excel, Access หรือโปรแกรมฐานข้อมูลต่างๆ ได้ และที่สำคัญโปรแกรม R นั้นได้รับการยอมรับอย่างสูงในความสามารถ มีผู้ใช้เพิ่มขึ้นจากทุกวงการ เช่น Google,Facebook,Twitter, Pfizer และ Shell หรือองค์กรของรัฐระดับนานาชาติมากมายพูดได้ว่า R เป็นอนาคตอันใกล้ของเรา ในฐานะภาษากลางของการวิเคราะห์ข้อมูลทางสถิติ
จากประสบการณ์ของผู้เชี่ยวชาญพบว่า การเรียนภาษา R แบบต้นฉบับ (command-line interface) ในครั้งแรกจะมี Learning curve ที่ชันเกินไปสำหรับผู้เริ่มต้น ดังนั้นเราจึงต้องหันมาเรียนรู้โปรแกรมรูปแบบที่เป็น GUI (just click) เสียก่อนจึงจะสามารถสร้างชุมชนการเรียนรู้โปรแกรม R ขึ้นได้ และเป็นพื้นที่ดีสำหรับผู้ที่ต้องการศึกษา R ขั้นก้าวหน้าต่อไป โปรแกรม R มีให้เลือกใช้ได้ทุก OS เช่น Windows ,Linux และ Mac OSX อีกทั้งยังมีเมนูใช้งานที่ง่ายพอที่จะใช้ทดแทน Commercials software ในการเรียนรู้สถิติ ทำวิจัยหรือวิเคราะห์ข้อมูลได้ไม่ยาก
ในการอบรมคอร์สนี้จะเน้นให้ผู้เข้าอบรมได้รับความรู้เกี่ยวกับสภาพแวดดล้อมของ R ในวงกว้างและทดลองใช้ งาน R Commander (R ในรูปแบบ GUI) ตั้งแต่เริ่มติดตั้ง จนถึงในฟังก์ชั่นต่างๆ รวมทั้งการแปลความหมายผลลัพธ์จากเมนูคำสั่งทางสถิติต่างๆ เพื่อนำไปประยุกต์ใช้ตามความต้องการได้อย่างถูกต้องเหมาะสม ซึ่งการอบรมหลักสูตรนี้มีความคุ้มค่ามาก เหมาะกับยุคเศรษฐกิจพอเพียง และถือเป็นการพัฒนาศักยภาพของนักวิเคราะห์ข้อมูลสู่ระดับสากลต่อไป

หลักสูตรนี้เหมาะ สำหรับ
• บุคคลทั่วไปที่สนใจหรือทำงานเกี่ยวข้องกับการใช้สถิติ เป็นนักวิจัย นักวิชาการ อาจารย์
• นิสิตระดับปริญญาตรี –โท-เอก ที่สนใจการวิเคราะห์ข้อมูลทางสถิติด้วย Open source
• พนักงานภาครัฐและบริษัทเอกชนที่ต้องการวิเคราะห์ข้อมูลภายใน องค์กรของตนเองเพื่อเพิ่มประสิทธิภาพให้กับองค์กรด้วย Open source
• ผู้เข้าอบรมควรมีพื้นฐานด้านทฤษฎีสถิติ หรือเคยใช้โปรแกรมสำเร็จรูปทางสถิติมาบ้าง
สิ่งที่จะได้รับจาก การอบรม
• ผู้ผ่านการอบรมจะสามารถใช้โปรแกรม R ที่ไม่มีค่าใช้จ่ายด้านลิขสิทธิ์ในการวิเคราะห์ข้อมูลพื้นฐานได้
• ผู้ผ่านการอบรมจะสามารถติดตั้งโปรแกรม / แพ็คเกจที่จำเป็น และเลือกใช้เทคนิคทางสถิติขั้นพื้นฐาน ในโปรแกรม R เวอร์ชั่น Commander รวมถึงสามารถแปลผล หรือนำผลลัพธ์ไปประยุกต์ใช้ได้อย่างถูกต้องเหมาะสม

วิธีการอบรม
• บรรยายเนื้อหาเชิงปฏิบัติการ
• ทดลองใช้โปรแกรม R Commander โดยทำตามตัวอย่างที่วิทยากรจัดไว้ให้ขณะบรรยาย
• Workshop การวิเคราะห์ข้อมูลจากงานวิจัยจริง ตั้งแต่นำเข้าข้อมูลจนถึงการสรุปผล

วิทยากร
อาจารย์อมรเทพ ทองชิว

ประวัติการ ศึกษา
• ปริญญาตรี วิศวกรรมเครื่องกล มหาวิทยาลัยนเรศวร
• ปริญญาโท การจัดการประยุกต์ (เกียรตินิยม) สถาบันบัณฑิตพัฒนบริหารศาสตร์ (นิด้า)

ประสบการณ์การทำงาน
• วิศวกรฝ่ายซ่อมบำรุง บริษัท เอ็ม บี เค ลอนดรี้ จำกัด
• วิศวกรแผนกติดตั้ง บริษัท ฟอร์เบส จำกัด
• วิศวกรฝ่ายผลิต บริษัท โอลีน จำกัด
• ผู้จัดการทั่วไป และผู้จัดการฝ่ายพัฒนาระบบ บริษัท พาร์เวล อินเตอร์เนชั่นแนล จำกัด

ผลงานที่เกี่ยวกับวิทยากรโปรแกรมสถิติ
• วิทยากรหัวข้อ “การใช้โปรแกรม OpenStat สําหรับงานวิจัย” จัดโดยมหาวิทยาลัยศิลปากร (ปี 2552)
• วิทยากรหัวข้อ “การใช้โปรแกรม OpenStat สําหรับงานวิจัย” จัดโดยมหาวิทยาลัยราชภัฎลำปาง (ปี 2553)
• วิทยากรและนักเขียนของนิตยสาร โอเพ่นซอสทูเดย์ (Opensource2Days) (ปี 2552-ปัจจุบัน)

วันเวลาและสถานที่อบรม
วัน : วันที่ 28-29 สิงหาคม 2553 จำนวน 2 วัน
เวลา : ตั้งแต่เวลา 9.00-16.00 น.
สถานที่ : ห้องอบรมศูนย์อบรมสถิติ อาคารพี.เอ็ม.ทาว์เวอร์ ชั้น 6 (ฝั่งธนาคารยูโอบี)
ราคา : 4,500 บาท/ท่าน/หลักสูตร

โครงสร้างหลักสูตร
วันที่ 1 ทำความรู้จักกับฟังก์ชั่นต่างๆ ของ R Commander เวลา 9.00 น.-16.00 น.
ช่วงเช้า 9.00 – 12.00 น.
1.แนะนำโปรแกรม R และ R commander
• ประวัติความเป็นมาของ
• หลักการทำงานของ R
• ครอบครัว R และ package ที่สำคัญ
• ข้อดีข้อเสียของ R
• ความสามารถของ R
• ชุมชนผู้ใช้ R
2.การติดตั้งโปรแกรม R รวมถึงแพ็คเกจที่จำเป็นและนำเข้าข้อมูลจากไฟล์ต่างๆ
ช่วงบ่าย 13.00 – 16.00 น.
3.การจัดการเกี่ยวกับตัวแปร เช่น ตั้งชื่อตัวแปร การรวม หรือแยกไฟล์ข้อมูล การเปลี่ยนชื่อ กำหนดชื่อตัวแปรย่อย การคำนวนค่าตัวแปร การส่งออกชุดข้อมูล เป็นต้น
4.การวิเคราะห์ทางสถิติด้วย R commander
• การสรุปข้อมูลพื้นฐาน (Numerical summaries)
• การกระจายตัวของข้อมูล (Frequency distributions)
• การจัดการค่า Missing (Count missing observations)
• การสรุปข้อมูลทางสถิติ (Table of statistics)
• ตารางสหสัมพันธ์ (Correlation matrix)
• การทดสอบความสัมพันธ์ (Correlation test)
• การทดสอบการกระจายตัวแบบปกติ (Shapiro-Wilk test of normality)

วันที่ 2 ต่อเนื่องจากวันแรก ของ R commander. เวลา 9.00. น.-16.00 น.
ช่วงเช้า 9.00 – 12.00 น.
4.การวิเคราะห์ทางสถิติด้วย R commander (ต่อ)
• การทดสอบความสัมพันธ์แบบไคสแควร์ (Contingency tables)
• การทดสอบความแตกต่าง (Single-sample t-test, Indepentent samples t-test , Paired t-test, One-way ANOVA, Multi-way ANOVA)
• การทดสอบค่าสัดส่วน (Single-sample proportion test, Two-sample proportion test)
• การทดสอบค่าความแปรปรวน (Two-variances F-test , Bartlett's test , Levene's test )
5.การวิเคราะห์สถิติที่ไม่ใช้ พารามิเตอร์ (Non-Parametric Statistics)
• Two-sample Wilcoxon test
• Paired-samples Wilcoxon test
• Kruskal-Wallis test
• Friedman rank-sum test
6. การวิเคราะห์เชิงมิติ (Dimensional analysis)
• การหาค่าความเชื่อมั่น (Scale reliability)
ช่วงบ่าย 13.00 – 16.00 น.
7.การหาความสัมพันธ์ด้วยวิธีวิเคราะห์การถดถอย (Regression)
• การสร้างตัวแบบ เชิงเส้นตรง และไม่ใช่เส้นตรง
• การตรวจสอบความเหมาะสมของตัวแบบ
• การวิเคราะห์ความคลาดเคลื่อน (Residual Analysis)
8.การสร้าง กราฟแบบต่างๆ ด้วย R commander
Histogram ,Stem-and -leaf display ,Boxplot ,Quantile-comparison plot ,Scatterplot matrix
Line graph ,XY conditioning plot ,Plot of means Strip chart ,Bar graph & Pie chart

วันจันทร์ที่ 5 เมษายน พ.ศ. 2553

Linux MSX

หลายคนเปลี่ยนมาใช้ Linux เพราะความสามารถ เช่น ระบบ Multi-touch เห็นใน youtube น่าจะเอามาลองเล่นดูนะครับ



วันพฤหัสบดีที่ 1 เมษายน พ.ศ. 2553

Data Analysts Captivated by R’s Power

Stuart Isett for The New York Times
R first appeared in 1996, when the statistics professors Robert Gentleman, left, and Ross Ihaka released the code as a free software package.
By ASHLEE VANCE
Published: January 6, 2009

To some people R is just the 18th letter of the alphabet. To others, it’s the rating on racy movies, a measure of an attic’s insulation or what pirates in movies say.
Skip to next paragraph
Related


Bits: R You Ready for R?
The R Project for Statistical Computing
R is also the name of a popular programming language used by a growing number of data analysts inside corporations and academia. It is becoming their lingua franca partly because data mining has entered a golden age, whether being used to set ad prices, find new drugs more quickly or fine-tune financial models. Companies as diverse as Google, Pfizer, Merck, Bank of America, the InterContinental Hotels Group and Shell use it.
But R has also quickly found a following because statisticians, engineers and scientists without computer programming skills find it easy to use.
“R is really important to the point that it’s hard to overvalue it,” said Daryl Pregibon, a research scientist at Google, which uses the software widely. “It allows statisticians to do very intricate and complicated analyses without knowing the blood and guts of computing systems.”
It is also free. R is an open-source program, and its popularity reflects a shift in the type of software used inside corporations. Open-source software is free for anyone to use and modify. I.B.M., Hewlett-Packard and Dell make billions of dollars a year selling servers that run the open-source Linux operating system, which competes with Windows from Microsoft. Most Web sites are displayed using an open-source application called Apache, and companies increasingly rely on the open-source MySQL database to store their critical information. Many people view the end results of all this technology via the Firefox Web browser, also open-source software.
R is similar to other programming languages, like C, Java and Perl, in that it helps people perform a wide variety of computing tasks by giving them access to various commands. For statisticians, however, R is particularly useful because it contains a number of built-in mechanisms for organizing data, running calculations on the information and creating graphical representations of data sets.
Some people familiar with R describe it as a supercharged version of Microsoft’s Excel spreadsheet software that can help illuminate data trends more clearly than is possible by entering information into rows and columns.
What makes R so useful — and helps explain its quick acceptance — is that statisticians, engineers and scientists can improve the software’s code or write variations for specific tasks. Packages written for R add advanced algorithms, colored and textured graphs and mining techniques to dig deeper into databases.
Close to 1,600 different packages reside on just one of the many Web sites devoted to R, and the number of packages has grown exponentially. One package, called BiodiversityR, offers a graphical interface aimed at making calculations of environmental trends easier.
Another package, called Emu, analyzes speech patterns, while GenABEL is used to study the human genome.
The financial services community has demonstrated a particular affinity for R; dozens of packages exist for derivatives analysis alone.
“The great beauty of R is that you can modify it to do all sorts of things,” said Hal Varian, chief economist at Google. “And you have a lot of prepackaged stuff that’s already available, so you’re standing on the shoulders of giants.”
R first appeared in 1996, when the statistics professors Ross Ihaka and Robert Gentleman of the University of Auckland in New Zealand released the code as a free software package.
According to them, the notion of devising something like R sprang up during a hallway conversation. They both wanted technology better suited for their statistics students, who needed to analyze data and produce graphical models of the information. Most comparable software had been designed by computer scientists and proved hard to use.
Lacking deep computer science training, the professors considered their coding efforts more of an academic game than anything else. Nonetheless, starting in about 1991, they worked on R full time. “We were pretty much inseparable for five or six years,” Mr. Gentleman said. “One person would do the typing and one person would do the thinking.”
Some statisticians who took an early look at the software considered it rough around the edges. But despite its shortcomings, R immediately gained a following with people who saw the possibilities in customizing the free software.
John M. Chambers, a former Bell Labs researcher who is now a consulting professor of statistics at Stanford University, was an early champion. At Bell Labs, Mr. Chambers had helped develop S, another statistics software project, which was meant to give researchers of all stripes an accessible data analysis tool. It was, however, not an open-source project.
The software failed to generate broad interest and ultimately the rights to S ended up in the hands of Tibco Software. Now R is surpassing what Mr. Chambers had imagined possible with S.
“The diversity and excitement around what all of these people are doing is great,” Mr. Chambers said.

Data Analysts Captivated by R’s Power
Published: January 6, 2009
(Page 2 of 2)
While it is difficult to calculate exactly how many people use R, those most familiar with the software estimate that close to 250,000 people work with it regularly. The popularity of R at universities could threaten SAS Institute, the privately held business software company that specializes in data analysis software. SAS, with more than $2 billion in annual revenue, has been the preferred tool of scholars and corporate managers.
Skip to next paragraph
Related
Bits: R You Ready for R?
The R Project for Statistical Computing
“R has really become the second language for people coming out of grad school now, and there’s an amazing amount of code being written for it,” said Max Kuhn, associate director of nonclinical statistics at Pfizer. “You can look on the SAS message boards and see there is a proportional downturn in traffic.”
SAS says it has noticed R’s rising popularity at universities, despite educational discounts on its own software, but it dismisses the technology as being of interest to a limited set of people working on very hard tasks.
“I think it addresses a niche market for high-end data analysts that want free, readily available code," said Anne H. Milley, director of technology product marketing at SAS. She adds, “We have customers who build engines for aircraft. I am happy they are not using freeware when I get on a jet.”
But while SAS plays down R’s corporate appeal, companies like Google and Pfizer say they use the software for just about anything they can. Google, for example, taps R for help understanding trends in ad pricing and for illuminating patterns in the search data it collects. Pfizer has created customized packages for R to let its scientists manipulate their own data during nonclinical drug studies rather than send the information off to a statistician.
The co-creators of R express satisfaction that such companies profit from the fruits of their labor and that of hundreds of volunteers.
Mr. Ihaka continues to teach statistics at the University of Auckland and wants to create more advanced software. Mr. Gentleman is applying R-based software, called Bioconductor, in work he is doing on computational biology at the Fred Hutchinson Cancer Research Center in Seattle.
“R is a real demonstration of the power of collaboration, and I don’t think you could construct something like this any other way,” Mr. Ihaka said. “We could have chosen to be commercial, and we would have sold five copies of the software.”

Refference: http://www.nytimes.com/2009/01/07/technology/business-computing/07program.html?_r=3&pagewanted=2&sq=R&st=cse&scp=2
access at: 31-Mar-2010

วันพุธที่ 17 มีนาคม พ.ศ. 2553

Who am I ?

We are consulting about Open source Statistic program.
If you want to use or analyze statistic ,Data Mining and Statistic process control (cp cpk). You know you can use OpenStat ,R programing ,Rattle or Weka ... Wow its freely. You may not familiar with these So I'll be a consulting or trainer for using these program..


E-mail : amto15@hotmail.com
Mobile: +66 97766-306

วันพฤหัสบดีที่ 4 มีนาคม พ.ศ. 2553

หลักสูตรอบรม "เปิดโลกสถิติ พิชิตข้อมูลด้วย OpenStat" รุ่น 2 มาแล้วคร้าบ..

ด่วน !! ตอนนี้ทาง Opensource2Days ได้เปิดหลักสูตร OpenStat รุ่น 2 แล้วนะครับ รายละเอียดดูที่
http://www.opensource2day.com/index.php?option=com_attend_events&task=view&id=42&Itemid=66

ผมได้มีโอกาสไปอบรมให้กับกลุ่มอาจารย์ที่ มหาวิทยาลัยของรัฐ และ ม.ราชภัฎมาหลายที่ ซึ่งต้องขอชื่นชมผู้บริหารของสถาบันศึกษาดังกล่าวที่มีวิสัยทัศน์ และเจตนารมย์ที่ดีในการที่จะไม่ละเมิดลิขสิทธิ์ SPSS เพราะถ้าภาคการศึกษาใช้แค่สถิติพื้นฐานในการเรียนการสอน ทั่วไป สามารถทดลองใช้หรืออบรม OpenStat เพียง 2 วัน ก็ใช้งานได้ทันทีครับ ตัวอย่างสถิติหลัก ๆ ที่ OpenStat ทำได้ เช่น
สถิติเชิงพรรณนา (Descriptive Statistics)
การวิเคราะห์ข้อมูลเชิงพรรณา เช่น ความถี่ ร้อยละ ความเบี่ยงเบน ความเบ้ ความโด่ง
การทดสอบการกระจายตัวแบบปกติของข้อมูล
การสร้างกราฟ เช่น Histograms, Pie chart, Bar chart, QQ plot ,Bubble plot ,X versus Y plot, Box plot และ Stem & leaf plot

การทดสอบเกี่ยวกับการทดสอบค่าเฉลี่ย (Mean) 1 กลุ่ม และ 2 กลุ่ม
การ วิเคราะห์ความแปรปรวน (Analyzes of Variance)
การวิเคราะห์ความแปรปรวน แบบทางเดียว และหลายทาง
การ วิเคราะห์ความสัมพันธ์ (Correlation)
การหาความสัมพันธ์ระหว่าง 2 ตัวแปร ด้วย Pearson Correlation
การหาความสัมพันธ์ด้วยวิธีวิเคราะห์การถดถอย (Regression)
การวิ เคราะห์การถดถอยพหุคูณ (Multiple Regression)
Multiple REGRESSION
NON-LINEAR REGRESSION
การวิเคราะห์สถิติหลายตัวแปร (Multivariate Statistics)
DISCRIMINANT FUNCTION / MANOVA
CLUSTER ANALYSES (Hierarchical & K-Means Clustering)
PATH ANALYSIS
FACTOR ANALYSIS
การวิเคราะห์สถิติที่ไม่ใช้พารามิเตอร์ (Non-Parametric Statistics)

การหาคุณภาพเครื่องมือวัด (Measurement)
การคำนวณค่า Cronbach alpha หรือ Kuder-Richadson



คือถ้าหน่วยงานใดที่ใช้สถิติพื้นฐานตามที่กล่าวมานี้ แล้วยังไม่ได้ซื้อลิขสิทธิ์โปรแกรมเชิงพาณิชย์มาก่อน ขอแนะนำให้มาอบรมหลักสูตรนี้ด่วนเลย อบรมแล้วใช้ได้ทันทีครับ

ใช้โปรแกรม R ไม่ยากอย่างที่คิด... :-]

มีใครรู้จักโปรแกรม R กันบ้างไหมครับ (http://www.r-project.org/) หลายท่านบ่นว่าใช้ยาก Learning curve มันสูงไป เพราะต้องการพิมพ์คำสั่งไปทีละบรรทัด แต่ด้วยความเคารพครับ ผมพบว่าโปรแกรม R นี่มันสุดยอดไปเลย มี package เกี่ยวกับสถิติ และกราฟฟิก มากมายเป็นหมื่นๆ (อารมณ์คล้าย ๆ Application ใน i-Phone ที่เพิ่มตามผู้ใช้ที่สนใจไปได้เรื่อยๆ) คือนอกจากสถิติพื้นฐานทั่วไปแล้ว ก็มีเรื่องของ Data mining ,Statistic process control เช่น cp cpk ที่แผนกควบคุมคุณภาพทราบดี และอื่น ๆ อีกมากมาย หลายวงการพูด 3 วันไม่หมด ที่สำคัญ R เป็น OpenSource ที่เราทุกคนมีเสรีภาพในการใช้ครับ บางครั้งผมแปลกใจว่าโปรแกรมดีๆ อย่างนี้กลับไม่ถูกส่งเสริม หรือใช้ในการเรียนการสอนมากนัก ทุกวันนี้เราถูกสอนว่า SPSS ,Statistica ,AMOS ,Clementine นั้นทำงานอย่างไรกันซะมากกว่า หนังสือเกี่ยวกับ R ภาษาไทย ก็ยังเป็นเรื่องพื้นฐาน หรือเป็นเชิงวิจัยเฉพาะอยู่ อาจจะประยุกต์ใช้ลำบาก

แต่ถึงกระนั้น ผมก็ขอชวนทุกท่านที่หลงเข้ามาอ่านบทความนี้ ให้ทดลองใช้โปรแกรม R ครับ ลงทุนกับการพัฒนาความรู้คุ้มกว่าเยอะครับ เพราะภาคการศึกษา /ภาคธุรกิจส่วนใหญ่คงไม่มีเงินเป็นแสนเป็นล้านในการหาซื้อโปรแกรมลิขสิทธิ์หรอกครับ หรือถ้าลงโปรแกรมลิขสิทธิ์ไว้ที่องค์กร แต่ที่บ้าน คอมพิวเตอร์ส่วนบุคคลท่านล่ะครับ เป็นปัญหานำไปสู่การละเมิดลิขสิทธิ์อีก แต่ถ้าใครที่มีฐานะดีแล้ว อยากจะใช้ซอฟท์แวร์เชิงพาณิชย์ ผมก็ขอสนับสนุนเป็นอย่างยิ่งครับ เพราะเค้าก็ลงทุนสูงในด้านการตลาด และวิจัยพัฒนานะครับ

เร็วๆ นี้ผมจะพัฒนาหลักสูตรอบรมโปรแกรม R เชิงประยุกต์ใช้กับภาคธุรกิจ และหน่วยงานต่างๆ รวมถึงการวิเคราะห์แบบ Data Mining รายละเอียดลองติดตามดูได้ที่ www.reinforcebi.com นะครับ ลองเข้าไปดูนะครับ เว็บไซต์นี้ผมตั้งใจจะทำเป็นศูนย์ให้คำปรึกษาอบรมโปรแกรมวิเคราะห์ข้อมูลที่เป็น Open source โดยเฉพาะครับ

สรุปแล้ว จะเรียนรู้ R ก็เหมือนเรียนภาษาเพิ่มขึ้นอีก 1 ภาษา คือ ตอนนี้เราอาจพูดภาษา $?$$ ได้ แต่ถ้าเราพูดภาษา R เพิ่มได้อีกภาษาล่ะ ดีกว่าไหมครับ

วันจันทร์ที่ 1 มีนาคม พ.ศ. 2553

ภาษา R คือสิ่งที่จำเป็นต้องเรียนรู้

ถ้าคุณใช้แค่สถิติพืนฐานเหล่านี้ ทำไม ไม่ใช้ R โปรแกรมที่มีสภาพแวดล้อมในการวิเคราะห์สถิติ OpenSource ในรูปแบบ GUI ที่ชื่อ R commander ล่ะครับ
Statistics
Frequency distribution
Table of statistics
Correlation matrix
Contingency Tables
Two-way table
Multi-way table

Means
Single sample t-test
Independent-samples t-test
Paired t-test
One-way ANOVA
Multi-way ANOVA
Proportions
Single-sample proportion test
Two-sample proportions test
Variances
Two-variances F-test
Bartlett’s test
Levene’s test

Nonparametric tests
Two-sample Wilcoxon test
Paired-samples Wilcoxon test
Kruskal-Wallis test

Dimensional analysis
Scale reliability
Principal-components analysis
Factor analysis
Cluster analysis
k-means cluster analysis
Hierarchical cluster analysis

Fit models
Linear regression
Linear model
Generalized linear model
Multinomial logit model
Proportional-odds logit model

วันศุกร์ที่ 22 มกราคม พ.ศ. 2553

LazStats คือ OpenStat สำหรับ Windows, Linux & Mac OS X

ผู้พัฒนา OpenStat ได้ออก Version ใหม่ชื่อ LazStats ที่ใช้ได้ทุกระบบ ทั้ง Windows ,Linux และ Mac OS X เวอร์ชั่นนี้มีหน้าตาที่ทันสมัยขึ้นแต่ฟังก์ชั่นยังไม่ครบเท่า OpenStat แต่กำลังปรับปรุงให้ครบถ้วนอยู่ครับ ทดลองใช้ดูได้ที่ http://statpages.org/miller/LazStats/ แล้วคุณจะชอบ LazStats