elektrik port üyelik servisleri elektrik port üyelik servisleri

R Programlama Matrisler ve Faktörler |
4. Bölüm

R programlama dilinde dosyalardan veri okuma yöntemlerini incelediğimiz yazımızda ayrıca matrisler, veri çerçeveleri ve faktörler gibi veri yapılarına değineceğiz. Gelin yazımızı beraber inceleyelim.



A- A+
02.09.2019 tarihli yazı 13808 kez okunmuştur.

Matris

Matrisler temelde boyutu olan vektörlerdir. Matrislerin satırları ve sütunları vardır.

Matris oluşturmak için matrix() fonksiyonu kullanılır. Birinci argüman matrisin satır sayısını, ikinci argüman da matrisin sütun sayısını verir.

dim() fonksiyonu ile matrisin boyutları yani satır ve sütun sayısı öğrenilir.
 
 

Yukarıdaki kod parçasında elemanı olmayan, 2 satır ve 3 sütundan oluşan bir matris tanımladık.  Ve dim() fonksiyonunu kullanarak satır ve sütun sayısını kontrol ettik.

Matrise eleman atandığında yerleştirme en üst soldan yani birinci satırın birinci sütunundan başlar. Daha sonra önce sütunlar dolacak şekilde diğer elemanlar yerleştirilir.
 


Matrisler, vektörler kullanılarak oluşturulabilir.
 

cbind()  ve rbind() fonksiyonları kullanılarak iki vektörün birleştirilmesi ile matrisler elde edilebilir. cbind() fonksiyonu ile ilk argümanın eleman sayısı yeni matrisin sahip olduğu sütun sayısı, rbind() fonksiyonu ile ilk argümanın eleman sayısı yeni matrisin satır sayısı olarak belirlenir.
 


İlginizi Çekebilir: Phyton Programlama 1. Bölüm

 

Faktör

Faktörler kategorilere ayrılmış verileri temsil eder. Faktörler sıralı ve ya sırasız olabilir. factor() fonksiyonu kullanılarak oluşturulurlar.
 

Faktörlerde sıra önemlidir. Sıra belirtilmediğinde veriler alfabetik sıraya göre sıralanır. levels argümanı kullanılarak veriler istenilen öncelikte sıralanabilir.
 


 

Veri Çerçevesi

R programlama dilinde veri çerçeveleri tablo halindeki verileri saklamak için kullanılır. Veri çerçevelerinden özellikle istatistiksel modelleme yapılırken faydalanılır.


Listelerde olduğu gibi veri çerçeveleri de farklı nesne türlerinden veriler içerebilir.



Veri çerçevelerini diğer veri yapılarından ayıran bir özellik de satırlarının rownames() fonksiyonu kullanılarak isimlendirilebilmesidir.


Veri çerçeveleri çoğunlukla data.frame(), read.csv() ve ya read.table() fonksiyonları kullanılarak oluşturulur.  Bu kullanımlara veri okuma başlığı altında daha ayrıntılı değineceğiz.

Veri çerçeveleri data.matrix() fonksiyonu ile matrislere dönüştürülebilir.



read.table() Kullanılarak Veri Okumak


R programlama dilinde veri okurken sıklıkla kullanılan fonksiyonlardan biri read.table() fonksiyonudur. read.table() fonksiyonu ile okunan veriler otomatik olarak veri çerçevesine dönüştürülür. Bu fonksiyonun pek çok önemli argümanı vardır.
     
file
argümanı okunacak dosyanın adını belirtir.
     
header
argümanı okunacak verilerin bir başlığı olduğu durumlarda kullanılır.

sep sütunları birbirinden ayıran ayracı belirtir. Bu ayraç bir string şeklinde belirtilir.

nrows satır sayısını belirtir. Bu argüman kullanılarak bir dosyada istenilen satır sayısına kadar olan elemanlar okunur. Bu argümanın kullanılmaması tüm satırların okunacağı anlamına gelir.

►  skip atlanan satır sayısını belirtir.

 
R programlama dilinde web içerikleri, text dosyaları, Excel dosyaları gibi pek çok farklı dokümandan okuma yapılabilir. Veri okurken çalıştırılan R dizini ile okumak istenen dosyanın aynı dizinde olmasına dikkat edilmelidir. Üzerinde çalıştığımız R dizinini getwd() fonksiyonunu kullanarak öğrenebiliriz.



Bu dizinde içinde farklı kentlerin ilçeleri ile ilgili bilgiler bulunan kentler.txt uzantılı bir dosya oluşturalım.



read.table() fonksiyonunu kullanarak bu text dosyasını okuyalım.


Kentler text dosyasının içinde il, ilçe, nüfus ve yüzölçümü kelimeleri verilerin başlığı niteliğinde olduğundan header argümanına TRUE değer atadık. Text dosyasındaki verileri ayırmak için eğik çizgi kullandığımızdan sep argümanına “/” karakterini atadık.

 
read.csv() Kullanarak Veri Okumak

 

read.csv(), read.table() ile oldukça benzer özelliklere sahiptir. read.table() fonksiyonu verileri ayırmak için boşluk karakterini kullanırken read.csv() dosyasında veriler virgülle ayrılmıştır.
 

maas.csv uzantılı Excel dosyamızı read.csv() fonksiyonunu kullanarak okuduğumuz örneği inceleyelim.
 

Bir sonraki yazımızda R programlama dilinde alt kümeleme işlemine ve loop fonksiyonlarına değineceğiz.

 

Kaynak:

►Coursera



Aktif etkinlik bulunmamaktadır.
ANKET
Endüstri 4.0 için En Hazır Sektör Hangisidir

Sonuçlar