Hier geht es darum, einen Server einzurichten, auf dem R-Anwendungen laufen sollen. Die Applikationen werden die Daten aus Oracle- und PostgreSQL-Datenbanken holen und die Ergebnisse in PostgreSQL ablegen. Als Basis dient ein neu installierter Ubuntu Server.

In Teil 1 werden die notwendigen Schritte zur Einrichtung der Datenbankverbindungen erläutert. Teil-2 beschreibt die Installations- und Konfigurationsschritte, die für die Einrichtung der Entwicklungs- und Ausführungsumgebung von R-Anwendungen erforderlich sind.

Voraussetzungen

  • Als Basis wird ein Ubuntu-Server mit der Version 22.04 verwendet.
  • Des Weiteren ist ein SSH-Zugang zum Server erforderlich.
  • Man braucht einen Benutzer mit Sudo-Rechten.
  • Die Oracle- und PostgreSQL-Datenbanken müssen netzwerktechnisch freigeschaltet werden.

Updates einspielen

Mit den folgenden drei Befehlen aktualisieren Sie das Ubuntu-System.

Ich würde vorschlagen, den Server neu zu starten.

Verbindung zu PostgreS testen

Die Verbindung zur PostgreSQL-Datenbank wird mit dem psql Client getestet. Installieren Sie diesen mit dem folgenden Befehl.

Verbinden Sie jetzt.

Installieren Sie Oracle Client

Wechseln Sie mit den folgenden Schritten zu Root, laden Sie die nötige Datei herunter und führen Sie die Installation von Oracle Instant Client aus.

Wechsel zu root :

Erstellen Sie nun für den Client einen Ordner unter /opt :

Laden Sie Oracle Instant Client herunter :

Entpacken Sie die Datei :

Installieren Sie die Linux asynchronous I/O Library :

Fügen Sie den Pfad zum Oracle Instant Client zur Systemkonfiguration hinzu :

Fügen Sie den Pfad zum Oracle Instant Client zum LD Library Path hinzu. Erstellen Sie dafür eine .sh-Datei unter dem Pfad /etc/profile.d und geben Sie darin die Umgebungsvariablen an. Damit gilt diese Konfiguration für alle BenutzerInnen.

Starten Sie den Server neu :

Lassen Sie die tnsnames.ora und sqlnet.ora Dateien von Ihrem Datenbankadministrator oder Ihrer Datenbankadministratorin zukommen und legen Sie diese unter /opt/oracle/instantclient_23_4/network/admin/ ab.

Verbindung zu Oracle testen

Mit sql*plus testen Sie, ob die Verbindung zur Oracle-Datenbank funktioniert. So sehen Sie sofort, ob der Oracle-Client richtig konfiguriert wurde. Um sql*plus zu installieren, müssen Sie folgende Schritte (als root) ausführen.

Um sql*plus aufrufen zu können, müssen weitere Umgebungsvariablen gesetzt werden. Diese Einstellungen werden hiermit für alle Benutzer gleichzeitig eingestellt. Dazu wird die früher erstellte zusätzliche_einstellungen.sh Datei erweitert.

Navigieren Sie zum Ordner /etc/profile.d, öffnen Sie die Datei mit einem Text-Editor, zum Beispiel nano, und fügen Sie die folgenden Ungebungsvariablen hinzu.

Starten Sie den Server erneut neu :

Nach der Neuanmeldung gehen Sie direkt zum Ordner der sqlplus-Datei und rufen Sie sie auf.

Installieren Sie Oracle ODBC

Die R-Applikationen werden die Daten aus den zwei Datenbanken PostgreSQL und Oracle über ODBC-Verbindungen abrufen. Dazu muss die Oracle ODBC-Komponente eingerichtet werden.

Installieren Sie die Oracle ODBC-Komponente, indem Sie folgende Schritte als root ausführen:

Lesen Sie gegebenenfalls die Readme-Datei:

Installieren Sie unixODBC

In diesem Schritt werden weitere Komponenten installiert, die für den Datentransfer über ODBC erforderlich sind. Führen Sie dazu (als root) die folgenden Befehle aus. Beachten Sie die Schreibweise (Kleinbuchstaben).

Konfigurieren Sie jetzt die ODBC-Komponente:

Sie müssen eine ODBC-Verbindung zur Oracle-Datenbank definieren:

Testen Sie die ODBC-Verbindung zur Oracle-Datenbank:

Umlaute prüfen

Sollten Sie bei den Abfragen aus der Oracle-Datenbank Probleme mit den Umlauten haben (diese werden nicht angezeigt), gibt es eine weitere Umgebungsvariable, die Ihnen weiterhilft. Fügen Sie die folgenden Sätze einfach zu unserer Profile-Datei hinzu:

Installieren Sie PostgreSQL ODBC

Um die PostgreSQL-Datenbank über ODBC erreichen zu können, müssen weitere Komponenten installiert werden. Führen Sie die folgenden Befehle aus:

Nach der erfolgreichen Installation erscheinen neue Einträge in der ODBC-Konfigurationsdatei. Diese müssen nun für die Angabe einer ODBC-Verbindung zur PostgreSQL-Datenbank verwendet werden.

Die Details der Verbindung zur PostgreSQL Datenbank werden ebenfalls in der odbc.ini Datei festgelegt.

Testen Sie die ODBC-Verbindung zur PostgreSQL-Datenbank:

Sie haben alle notwendigen Voraussetzungen geschaffen, um Daten aus Oracle- und PostgreSQL-Datenbanken für Ihre R-Anwendungen zu holen. Im Folgenden zeige ich Ihnen, wie Sie die R-Umgebung einrichten können.

Nützliche Links